腾讯发布“幻元世界模型1.5”:开启实时交互虚拟世界
发布日期:2025年12月17日
来源:AIbase
核心摘要
腾讯正式发布“HY WorldPlay模型1.5”(幻元世界模型1.5),这是中国首个开放的实时交互体验平台。该模型能够通过简单的文本描述或图像,快速生成独特的交互式虚拟世界,用户可像玩游戏一样实时探索AI生成的场景。
模型核心能力
1. 实时交互生成
- 技术方案:采用原创的“Context Forcing”蒸馏方案与流式推理优化。
- 性能表现:能够以24帧/秒的速度生成高清视频流,实现流畅的实时交互。
2. 长程3D一致性
- 当用户离开某个区域后再次返回时,模型能够准确“记忆”该区域的3D结构。
- 效果:确保了场景的连贯性与空间逻辑的一致性。
3. 多样化交互体验
- 适用场景:适配不同风格的游戏或现实场景。
- 交互功能:支持多视角切换与实时文本触发事件。
- 控制方式:用户可通过键盘、鼠标或控制器实时操控虚拟摄像机进行探索。
技术突破与开源贡献
本次发布同步开源了业界最全面的实时世界模型训练系统,覆盖数据、训练、推理部署全流程。腾讯混元团队在技术报告中详细阐述了自回归视频模型的预训练、持续训练与强化学习等技术细节。
- 核心任务:采用名为“Next-Frames-Prediction”的视觉自回归任务。
- 关键突破:打破了实时性能与几何一致性之间的矛盾,为世界建模提供了新的可能性。
应用前景与意义
该模型不仅实现了技术突破,也为AIGC(人工智能生成内容)的未来开辟了更广阔的想象空间。未来,AI将不再局限于生成文本、图像或视频,而是能够创造完整的、可实时探索与交互的虚拟世界。
- 主要应用领域:游戏开发、影视制作、虚拟现实(VR)等。
相关资源链接
- 在线体验网站:https://world.hunyuan.tencent.com
- GitHub 链接:https://github.com/Tencent/HunyuanWorld
- Hugging Face 链接:https://huggingface.co/Tencent/HunyuanWorld
- 项目主页:https://world.hunyuan.tencent.com/#/home
