AI-NEWS · 2026年 1月 29日

腾讯开源最强文生图模型

腾讯混元图像3.0正式开源:全球最强开源图像生成模型,800亿参数赋能AI创作

核心摘要

2026年1月28日,腾讯混元团队正式开源其最新图像生成模型——混元图像3.0(HunyuanImage3.0-Instruct)。该模型以800亿总参数(约130亿激活参数)的混合专家架构,在全球图像编辑排名LMArena中位列第七,成为当前全球最强的开源图像生成模型。

技术突破

架构与性能

  • 模型架构:采用混合专家架构,总参数量达800亿,激活参数约130亿。
  • 全球排名:在LMArena全球图像编辑排行榜中排名第七,进入顶级梯队。
  • 核心理念:“先思考,后编辑”。模型采用原生多模态架构,深度融合文本与视觉理解。

关键技术

  1. 思维链注入:利用数千万规模的数据,注入思维链技术,使模型学会先分析图像内容和用户意图,再执行任务,从而生成精准的编辑指令。
  2. 自研算法:结合自研的MixGRPO算法,在指令遵循和非编辑区域一致性保持方面表现优异。

功能与应用场景

全面编辑功能

支持添加、删除、修改、风格转换、人物与文字修改、老照片修复、多图融合等多种功能。

多场景赋能

  • 普通用户:成为制作表情包、社交媒体分享的强力工具。
  • 专业设计师:显著提升电商海报制作、游戏角色定制等工作的效率。

开源承诺

资源开放

  • 托管平台:模型权重和完整代码已托管于GitHub和Hugging Face。
  • 版本发布:除标准版外,还发布了模型的蒸馏版本,以降低开发者的使用门槛。

开发者支持

开发者和研究人员可直接获取资源,基于这一强大的基础平台进行应用开发和二次开发。

体验与获取

  • 官方体验:可通过腾讯混元官方网站体验模型功能。
  • 开源地址:开发者可通过GitHub和Hugging Face平台直接访问模型资源。

行业背景

此次开源紧随腾讯“元宝春节10亿红包”活动之后,显示了腾讯在AI开源领域的持续投入。混元图像3.0的开源有望进一步降低高质量图像生成技术的使用门槛,推动AI创作工具的普及和创新。


信息来源:AIbase Daily,2026年1月28日发布

火龙果频道