AI-NEWS · 2025年 9月 3日

腾讯开源3D生成神器

腾讯混元团队开源HunyuanWorld-Voyager:全球首个原生3D重建世界模型登顶WorldScore榜首

模型核心突破

腾讯混元AI研究团队最新开源项目HunyuanWorld-Voyager近日引发全球AI与3D技术领域热议。作为具备原生3D重建能力的超长程世界模型,该模型在WorldScore排行榜上位居第一,在相机控制、内容对齐和3D一致性等关键指标上全面超越Gen-3等竞争对手。

技术亮点

原生3D重建能力

  • 单图像生成点云:仅需单张输入图像即可生成与现实世界一致的3D点云
  • 简化预处理流程:消除了传统3D建模所需的复杂预处理步骤
  • 多模态技术优势:依托腾讯在多模态生成领域的深厚积累,能高效捕捉图像的几何信息和语义细节

卓越相机控制

  • 自定义相机路径:用户可定制相机轨迹,模型按路径生成几何一致的3D场景
  • 长期空间一致性:保持长时间的空间连贯性,支持360°全景漫游和特定视角细节探索
  • 实时生成能力:支持实时生成精确对齐的深度信息和RGB视频,无需额外后处理

性能表现

根据最新数据,HunyuanWorld-Voyager在WorldScore排行榜关键指标表现:

  • 相机控制:全面领先
  • 内容对齐:超越现有模型
  • 3D一致性:行业最优

技术架构采用独特的多阶段设计,结合了:

  • 全景图像生成
  • 语义分层
  • 分层3D重建技术

应用场景

游戏开发

快速生成交互式3D世界,显著缩短开发周期

虚拟现实(VR)

生成沉浸式全景环境,提供逼真虚拟体验

前沿技术领域

  • 机器人导航
  • 自动驾驶
  • 增强现实(AR)

开源生态建设

腾讯2025开源计划

HunyuanWorld-Voyager的开源是腾讯混元团队2025开源计划的重要组成部分。此前腾讯已陆续开源:

  • Hunyuan3D-2.0
  • Hunyuan3D-2.1

覆盖从高分辨率资产生成到游戏场景优化的多项技术。

开源价值

  • 提供完整代码、模型权重和文档
  • 降低开发者使用门槛
  • 推动全球AI社区协同创新
  • 促进3D内容创作民主化
  • 为中小开发者和独立创作者提供顶级工作室级别工具

行业意义

该模型的开源标志着3D世界生成技术的又一次飞跃,其原生3D重建能力、卓越的相机控制和广泛的应用场景,不仅为开发者提供强大工具,更为AI驱动的虚拟世界探索开辟了新的可能性。

腾讯通过开源社区驱动模式,与Stable Diffusion等项目形成共鸣,对抗西方封闭生态垄断趋势,进一步巩固了在全球AI竞争中的领先地位。

火龙果频道