Diff4Splat: Geração controlável de cenas 4D com modelos de reconstrução dinâmica latente Contribuições: • Propomos o DIFF4SPLAT, um modelo unificado baseado em difusão que gera diretamente gaussianas 3D deformáveis para síntese controlável de cenas 4D. • Construímos um conjunto de dados 4D em larga escala a partir de vídeos sintéticos e reais, anotados com informações sobre aparência, geometria em escala métrica e movimento. • Experimentos extensivos demonstram que o DIFF4SPLAT produz cenas 4D de alta fidelidade a partir de uma única imagem, superando os pipelines de dois estágios e os métodos existentes de geração de vídeo controlados por câmera, tanto em qualidade quanto em eficiência.
Artigo:arxiv.org/abs/2511.00503m Projetopaulpanwang.github.io/Diff4Splat/Cy



