A Tencent acaba de disponibilizar o código aberto do HY-World 1.5, um modelo de mundo generativo interativo em tempo real, com saída de vídeo de longa duração em 720p a 24 fps, consistência 3D e controle arbitrário de texto/movimento. Basta fornecer uma frase ou um sinal de controle, e o sistema pode renderizar instantaneamente um vídeo em 3D infinitamente longo, geometricamente consistente, explorável, interativo e estilisticamente arbitrário. No HY-World 1.5, eles desenvolveram um modelo de difusão de vídeo em streaming chamado WorldPlay para alcançar a modelagem interativa do mundo em tempo real, mantendo a consistência geométrica a longo prazo, resolvendo assim o dilema entre velocidade e memória presente nos métodos atuais. Ele suporta perspectivas em primeira e terceira pessoa, o que é bastante útil para jogos e realidade virtual. #Mundo 3D Gerado por IA#HYWorld
Github: github.com/Tencent-Hunyua… Abraço facial:huggingface.co/tencent/HY-Wor…b