X (Twitter)

再構築、インペイント、テスト時の微調整：単眼ビデオからの動的な新規ビュー合成 TL;DR: CogNVS は、2D ビデオのみを使用して自己教師方式でトレーニングされた、動的な新規ビュー合成用のビデオ拡散モデルです。我々は、新規ビューの合成を構造化された修復タスクとして再定式化します。 1. 市販の SLAM システムを使用して入力ビューを再構築します。 2. インペインティングモデルを事前トレーニングするための自己教師ありトレーニングペアを作成します。 3. 推論時の入力に合わせてテスト時間を微調整します。

論文（pdf）: httpopenreview.net/pdf/51d7011247…ェクト: httpscog-nvs.github.io https://t.co/FD3FjbaVe7

論文（pdf）: https://t.co/taAbxdI20b
プロジェクト: https://t.co/lXPGZr0cnQ
コード: https://t.co/FD3FjbaVe7

MrNeRF（@janusch_patas）のスレッド

作者情報

スレッド内容