Tencent acaba de publicar el código abierto de HY-World 1.5, un modelo de mundo generativo interactivo en tiempo real, con salida de transmisión de video de 720p a 24 fps, consistencia 3D y control de texto/movimiento arbitrario. Dale una frase o una señal de controlador y puede reproducir en el acto un video en 3D infinitamente largo, geométricamente consistente, explorable, interactivo y estilísticamente arbitrario. En HY-World 1.5, desarrollaron un modelo de difusión de video en tiempo real llamado WorldPlay para lograr un modelado mundial interactivo en tiempo real manteniendo la consistencia geométrica a largo plazo, resolviendo así el problema de equilibrio entre velocidad y memoria en los métodos actuales. Admite perspectivas tanto en primera como en tercera persona, lo que resulta bastante útil para juegos y realidad virtual. #Mundo 3D generado por IA#HYWorld
Github: github.com/Tencent-Hunyua… Cara abrazada:huggingface.co/tencent/HY-Wor…b