WorldWarp: Propagando geometria 3D com difusão de vídeo assíncrona Contribuições: - WorldWarp: Uma nova estrutura para extrapolação de visão de longo alcance que gera vídeos em partes, utilizando um pipeline de inferência autorregressiva. - Difusão Espaço-Temporal (ST-Diff): Um modelo de difusão não causal que utiliza atenção bidirecional condicionada a imagens distorcidas para frente como um conhecimento geométrico prévio denso. - Um mecanismo de cache geométrico 3D online: Usa 3DGS otimizado em tempo de teste [25] para fornecer priors deformados de alta fidelidade, evitando a propagação irreversível de erros de representações 3D estáticas. - Desempenho de última geração em benchmarks desafiadores de extrapolação de visão, demonstrando consistência geométrica e qualidade de imagem significativamente aprimoradas em comparação com os métodos existentes.
Artigo:arxiv.org/abs/2512.19678m Projetohyokong.github.io/worldwarp-page/sa Códgithub.com/HyoKong/WorldW…JoNtz: Fundindo o conhecimento do mundo material 2D na geometria 3D



