4Real-Video-V2: Fusão de Atenção em Tempo de Visualização e Reconstrução Feedforward para Geração de Cenas 4D Contribuições: 1) Uma nova estrutura de geração 4D em dois estágios que produz uma grade de imagens e as converte em elipsoides gaussianos. 2) Um mecanismo de visão e atenção temporal integrado que permite a geração de vídeo 4D com uso eficiente de parâmetros. 3) Um modelo de feedforward que recupera conjuntamente os parâmetros da câmera e as partículas gaussianas a partir de vídeos multiview.
Artigo:arxiv.org/abs/2506.18839W Projetosnap-research.github.io/4Real-Video-V2/Pe



