騰訊剛剛開源了即時互動式生成世界模型:HY-World 1.5,24 fps 720p長視訊串流輸出+3D一致性+任意文字/動作控制 給它一句話/一個手柄信號,它能現場渲染出一段無限長、幾何一致、可探索可交互、風格任意的3D世界視頻 在HY-World 1.5裡他們搞了一個串流視訊擴散模型WorldPlay,實現即時互動的世界建模,並且保持長期的幾何一致性,解決了當前方法在速度與記憶之間存在的權衡難題 支援第一人稱與第三人稱視角,對於遊戲、虛擬實境等較為實用 #AI生成3D世界#HYWorld
Github: github.com/Tencent-Hunyua… Hugging Face: huggingface.co/tencent/HY-Wor…