Deep Gaussian from Motion: ガウス分布の 3D 幾何学的基礎モデルの探究 貢献: • ポーズフリーな基盤モデル適応:VGGT/MegaSAMは事前計算されたポーズ(不正確さの影響を受ける可能性がある)に依存しますが、本パイプラインはポーズアノテーションなしで動作します。これは、ガウスジオメトリを動的に改良し、光線整合の取れた新しいビュー合成とフォトメトリックな外観を一致させることで実現されます。 • プログレッシブかつモジュラーなフレームワーク設計:プログレッシブ設計により反復的なスケーラビリティを実現し、VGGTのようなパイプラインで顕著なGPUボトルネックを解消します。モジュール化によりシーンの多様性に対する堅牢性が確保され、高密度な画像セットによるメモリ制約に左右されることなくコンポーネントを改良できます。 • シーン固有のガウス予測:私たちの手法では、入力シーンごとにガウス形状を動的に予測し、そのシーン固有の測光特性と形状特性に適応して高品質の合成を実現します。この柔軟性は、入力をあまり適応的に処理しない VGGT/MegaSAM などのフィードフォワード手法ではあまり見られません。
論文(pdf): https://t.co/YLwEAEIDqS



