腾讯发布幻影图像3.0图生图模型:语义理解驱动,一句话实现精准编辑
概述
2026年1月26日,腾讯混元正式发布了其最新的幻影图像3.0图生图模型。该模型填补了混元在图像编辑与多图融合领域的重要空白,现已通过腾讯元宝全平台及官方网站开放使用。
核心特性与技术架构
1. 模型规模与架构
- 参数量:总参数量达800亿(激活参数量约130亿)。
- 架构:采用先进的混合专家模型架构。
2. 核心能力:语义理解与推理
与传统修图工具不同,该模型具备出色的语义理解和推理能力:
- 步骤分解:接收到图像和提示词后,模型会先分析图像内容,并分解编辑步骤。
- 精准识别:能准确识别需要修改和需要保留的区域。
3. 性能提升
基于海量的图生图数据及自研的MixGRPO算法,模型在以下方面取得显著改进:
- 一致性保持:在非编辑区域保持高度一致性。
- 响应速度:指令响应速度更快。
- 真实感:生成效果更为逼真。
应用场景与功能
模型支持超过80项子任务,为用户提供多样化的创作能力:
-
图像精修:
- 支持添加、移除或修改光线、皮肤、背景。
- 甚至能在不破坏布局的情况下更改图像中的文字。
-
风格转换:
- 实现真人转卡通、转换为像素风格。
- 支持老照片修复。
-
深度融合:
- 支持从多张照片中提取人物或元素,快速创作新的拼贴图或创意图像。
目前,用户已可通过腾讯元宝体验AI制作表情包、虚拟合唱、电商海报设计等功能。
行业意义
此举标志着大模型正式进入高效“意图驱动”的图像编辑时代。
信息来源:AIbase,2026年1月26日。
