AI-NEWS · 2026年 1月 27日

腾讯发布幻影3.0图像模型

腾讯发布“幻影”图像3.0图生图模型:图像编辑进入“思考”时代

核心发布

2026年1月26日,腾讯混元正式发布幻影图像3.0指令模型(HunyuanImage3.0-Instruct)。该模型已在腾讯AI助手“元宝”全平台及腾讯混元官网上线,标志着腾讯在原生多模态图像处理领域取得新突破。

技术架构与核心能力

  • 架构与规模:采用主流的混合专家模型架构,总参数量达800亿,激活参数量约为130亿
  • 核心创新:被定义为“智能”图像编辑模型。其工作流程与传统滤镜式编辑有本质区别:
    1. 深度理解:接收用户指令和图像后,首先深度理解图像内容。
    2. 自主推理:自主推理需要修改的区域与步骤。
    3. 精准保留:精确保留无需更改的图像细节。
  • 结果:实现逻辑更连贯、一致性更高的输出。

功能亮点

模型展现出高度灵活性,覆盖广泛的应用场景:

  • 基础编辑:支持元素增删、风格转换、老照片修复。
  • 高级合成:具备强大的多图融合能力,可从多张照片中提取并合成人物或元素。
  • 应用场景:用户可快速创建个性化贴纸、虚拟合唱,甚至直接在“元宝”上完成专业的电商海报设计和角色定制。

训练与性能提升

为精炼此模型,混元团队构建了大规模图生图数据集,并引入了创新训练方法:

  • 数据集:覆盖超过80项专项任务的大规模图生图数据集。
  • 训练方法:引入思维链训练及自研的MixGRPO算法
  • 性能提升
    • 指令响应速度和图像一致性显著提高。
    • 基于百万级图像数据集训练,生成图像的情感张力和真实感更强。
    • 图像生成速度相比前代显著加快。

关键要点总结

  1. 自主推理编辑:先理解后执行,自动分析修改区域并保持未编辑区域的一致性。
  2. 多场景覆盖:支持老照片修复、人像拼贴合成、复杂文字修改等,适用于电商海报、游戏定制等多种创意领域。
  3. 性能效率双提升:依托800亿MoE架构,在情感表达与生成速度上均有突破。

相关动态:腾讯“元宝”的社交化与春节活动

同一时期,腾讯AI助手“元宝”在社交功能与市场活动上亦有重大动作:

  • 社交功能“元宝派”:已启动内测,旨在打造AI深度参与的多人在线社交空间。AI可扮演健身、阅读伙伴等角色,并能总结群聊内容,标志着腾讯AI从效率工具向社交互动领域扩展。
  • 春节现金活动:腾讯董事会主席兼首席执行官马化腾在年会上宣布,“元宝”将于2026年2月1日启动春节现金派送活动,总金额达10亿元人民币,单个红包最高可达1万元,旨在复制微信红包的成功,推动AI应用的普及与商业化。

分析整理自AIbase于2026年1月26日的报道。

火龙果频道