1秒未満で鮮明な単眼ビューを合成 貢献: • エンドツーエンドのアーキテクチャ: 高解像度の 3D ガウス表現を予測するためにエンドツーエンドでトレーニングできる新しいネットワーク アーキテクチャを設計します。 • 堅牢で効果的な損失構成: トレーニングの安定性を維持し、一般的な視覚アーティファクトを抑制しながら、ビュー合成の品質を優先するために、一連の損失関数を慎重に選択します。 • 深度アライメント モジュール: 回帰ベースのビュー合成方法の基本的な課題である、トレーニング中の深度の曖昧さを効果的に解決できるシンプルなモジュールを導入します。
論文: httgithub.com/apple/ml-sharpジェクト: httpapple.github.io/ml-sharp/: https://t.co/KivbS9V8lR


