腾讯混元3D世界模型1.0正式开源:行业首个支持沉浸式漫游交互的开源世界生成模型
核心发布
- 发布时间:2025年7月27日(世界人工智能大会腾讯论坛)
- 核心突破:全球首个支持沉浸式漫游、交互与仿真的开源世界生成模型
- 技术亮点:
- 集成全景视觉生成与分层3D重建技术
- 支持文本/图像输入生成可导航3D场景
- 生成效率提升:专业团队数周工作 → 简单指令数分钟完成
关键技术指标
维度 | 表现 |
---|---|
生成质量 | 美学质量、指令跟随能力全面超越国际开源模型 |
兼容性 | 输出标准3D Mesh资产,支持Unity/Unreal/Blender等主流工具 |
算法创新 | "语义分层3D场景表示与生成算法"实现前景/背景、地面/天空智能分离 |
应用场景
- 游戏开发:快速生成含建筑/地形/植被的完整3D场景
- 支持Mesh文件直接用于游戏原型/关卡设计
- 可调整前景物体/替换天空背景
- VR体验:无建模经验用户可生成360°沉浸空间并导入Vision Pro等设备
开源生态布局
-
模型矩阵:
- 基础模型:混元TurboS(月更迭代,全球大模型权威排名前列)
- 增强模型:混元T1(国内领先的综合推理能力)
- 专项模型:混元语音(端到端语音)、混元视觉(多模态理解)
-
即将开源:
- 轻量级混合推理模型(0.5B/1.8B/4B/7B)
- 多模态理解模型Hunyuan-large-vision
- 游戏场景交互式视频生成框架Hunyuan GameCraft
-
3D生成领域:
- 混元3D2.5模型纹理质量显著提升(上海AI实验室评测全球第一)
- 系列模型社区下载量突破230万次(全球最受欢迎3D开源模型之一)
开发者支持
- 提供接近商业模型性能的开源基底
- 完整的多模态生成能力及工具链插件
- 已开源文本→图像/视频/3D生成能力