AI-NEWS · 2025年 7月 31日

通义千问3对标GPT-4o

阿里通义千问发布Qwen3-30B-A3B-Instruct-2507开源模型

核心亮点

  • 发布时间:2025年7月30日
  • 技术突破:仅激活3B参数即可对标Gemini 2.5-Flash和GPT-4o等闭源模型
  • 开源平台:ModelScope社区和HuggingFace平台

关键性能指标

测试领域 测试名称 得分 对比表现
数学推理 AIME25 61.3 部分超越GPT-4o
代码生成 LiveCodeBenchv6 43.2
物理/天文 GPQA 70.4
人类偏好对齐 Arena-Hard v2 69

技术特性

  1. 多语言支持:优化了长尾知识的多语言覆盖
  2. 用户偏好对齐:在主观开放任务中生成更高质量文本
  3. 长文本处理:上下文理解能力提升至256K tokens
  4. 计算效率:显著降低计算成本,追求万亿参数闭源模型的性能

市场影响

  • 通义千问系列自2023年发布以来:
    • 开源模型数量:200+
    • 全球下载量:超3亿次
    • 衍生模型数量:10万+

火龙果频道