腾讯混元图像3.0正式开源:全球最强开源图像生成模型,800亿参数赋能AI创作
核心摘要
2026年1月28日,腾讯混元团队正式开源其最新图像生成模型——混元图像3.0(HunyuanImage3.0-Instruct)。该模型以800亿总参数(约130亿激活参数)的混合专家架构,在全球图像编辑排名LMArena中位列第七,成为当前全球最强的开源图像生成模型。
技术突破
架构与性能
- 模型架构:采用混合专家架构,总参数量达800亿,激活参数约130亿。
- 全球排名:在LMArena全球图像编辑排行榜中排名第七,进入顶级梯队。
- 核心理念:“先思考,后编辑”。模型采用原生多模态架构,深度融合文本与视觉理解。
关键技术
- 思维链注入:利用数千万规模的数据,注入思维链技术,使模型学会先分析图像内容和用户意图,再执行任务,从而生成精准的编辑指令。
- 自研算法:结合自研的MixGRPO算法,在指令遵循和非编辑区域一致性保持方面表现优异。
功能与应用场景
全面编辑功能
支持添加、删除、修改、风格转换、人物与文字修改、老照片修复、多图融合等多种功能。
多场景赋能
- 普通用户:成为制作表情包、社交媒体分享的强力工具。
- 专业设计师:显著提升电商海报制作、游戏角色定制等工作的效率。
开源承诺
资源开放
- 托管平台:模型权重和完整代码已托管于GitHub和Hugging Face。
- 版本发布:除标准版外,还发布了模型的蒸馏版本,以降低开发者的使用门槛。
开发者支持
开发者和研究人员可直接获取资源,基于这一强大的基础平台进行应用开发和二次开发。
体验与获取
- 官方体验:可通过腾讯混元官方网站体验模型功能。
- 开源地址:开发者可通过GitHub和Hugging Face平台直接访问模型资源。
行业背景
此次开源紧随腾讯“元宝春节10亿红包”活动之后,显示了腾讯在AI开源领域的持续投入。混元图像3.0的开源有望进一步降低高质量图像生成技术的使用门槛,推动AI创作工具的普及和创新。
信息来源:AIbase Daily,2026年1月28日发布
