Síntese de visão monocular nítida em menos de um segundo Contribuições: • Arquitetura de ponta a ponta: Projetamos uma nova arquitetura de rede que pode ser treinada de ponta a ponta para prever representações gaussianas 3D de alta resolução. • Configuração de perda robusta e eficaz: Selecionamos cuidadosamente uma série de funções de perda para priorizar a qualidade da síntese de visualização, mantendo a estabilidade do treinamento e suprimindo artefatos visuais comuns. • Módulo de alinhamento de profundidade: Apresentamos um módulo simples que pode resolver eficazmente ambiguidades de profundidade durante o treinamento, um desafio fundamental para métodos de síntese de visualização baseados em regressão.
Artigo:github.com/apple/ml-sharpR Projetoapple.github.io/ml-sharp/9D Códgithub.com/apple/ml-sharp9V8lR


