AI-NEWS · 2025年 10月 7日

腾讯图像3.0全球夺冠

腾讯混元图像3.0登顶全球:用户真实投票验证文本生成图像能力

核心成就

  • 排名突破:在权威文本生成图像平台LMArena最新排名中位列第一
  • 竞争表现:超越26个全球大型模型,包括多个顶级闭源模型(如Nano Banana)
  • 评选机制:完全基于全球用户的成对比较投票,无任何"算法过滤",真实反映用户体验和偏好

技术突破

  • 核心能力:高质量图像生成能力实现重大突破
  • 里程碑意义:国产大模型在国际文本生成图像竞赛中的标志性胜利
  • 模型规模:800亿参数的多模态图像生成模型
  • 技术特性:首个工业级原生多模态模型,在复杂语义理解、文本生成图像(支持1000字符提示)和知识推理方面表现优异

功能发布计划

  • 当前开放:文本生成图像功能已面向用户体验
  • 后续规划:将陆续发布图像生成图像、图像编辑、多轮交互等高级功能

性能表现

  • 基准测试:在复杂场景下表现优异,超越GPT-5、Gemini、Claude 4等主流模型
  • 能力升级:相比擅长验证码识别的2.0版本,3.0版本显著扩展了视觉推理能力
  • 行业关注:获得AI社区的广泛关注

相关背景

  • 发布时间:2025年9月28日
  • 开源策略:腾讯开源了新一代图像生成模型混元图像3.0
  • 行业地位:在质量上可与领先的闭源模型相媲美

注:本文基于2025年10月6日发布的官方信息整理

火龙果频道