Synthèse d'une vue monoculaire nette en moins d'une seconde Contributions : • Architecture de bout en bout : Nous concevons une nouvelle architecture de réseau qui peut être entraînée de bout en bout pour prédire des représentations gaussiennes 3D haute résolution. • Configuration de perte robuste et efficace : Nous choisissons soigneusement une série de fonctions de perte pour privilégier la qualité de la synthèse des vues tout en maintenant la stabilité de l’entraînement et en supprimant les artefacts visuels courants. • Module d'alignement de profondeur : Nous introduisons un module simple capable de résoudre efficacement les ambiguïtés de profondeur pendant l'entraînement, un défi fondamental pour les méthodes de synthèse de vues basées sur la régression.
Articlegithub.com/apple/ml-sharp8lR Projeapple.github.io/ml-sharp/da9D Cgithub.com/apple/ml-sharpS9V8lR


