再構築、インペイント、テスト時の微調整:単眼ビデオからの動的な新規ビュー合成 TL;DR: CogNVS は、2D ビデオのみを使用して自己教師方式でトレーニングされた、動的な新規ビュー合成用のビデオ拡散モデルです。 我々は、新規ビューの合成を構造化された修復タスクとして再定式化します。 1. 市販の SLAM システムを使用して入力ビューを再構築します。 2. インペインティング モデルを事前トレーニングするための自己教師ありトレーニング ペアを作成します。 3. 推論時の入力に合わせてテスト時間を微調整します。
論文(pdf): httpopenreview.net/pdf/51d7011247…ェクト: httpscog-nvs.github.io https://t.co/FD3FjbaVe7



