Ok, isso é muito legal! EgoX: Gere vídeos imersivos em primeira pessoa a partir de qualquer clipe em terceira pessoa. Contribuições: • Propomos uma nova estrutura, EgoX, para sintetizar vídeos egocêntricos de alta fidelidade a partir de um único vídeo exocêntrico, explorando efetivamente modelos de difusão de vídeo pré-treinados. • Desenvolvemos uma estratégia de condicionamento unificada que combina vídeo exocêntrico e informações prévias egocêntricas por meio de integração em largura e em canais, alcançando consistência geométrica robusta e geração de alta qualidade. • Apresentamos a autoatenção guiada por geometria e representações latentes limpas que se concentram seletivamente em regiões relevantes para a visão e aprimoram a reconstrução precisa, levando a uma síntese egocêntrica mais coerente. • Experimentos qualitativos e quantitativos extensivos demonstram que o EgoX supera as abordagens anteriores por uma grande margem, alcançando desempenho de última geração em diversos e desafiadores benchmarks de geração de vídeo exo-para-ego.
Artigo:arxiv.org/pdf/2512.08269u Projetokeh0t0.github.io/EgoX/BT



