AI-NEWS · 2025年 9月 30日

通义7模型霸榜Hugging Face

阿里通义7款模型霸榜Hugging Face!全模态大模型Qwen3-Omni全球登顶

核心要点

  • 发布时间:2025年9月28日
  • 发布平台:全球最大AI开源社区Hugging Face
  • 主要成就:阿里通义7款模型进入全球开源模型排行榜前十
  • 明星产品:全新开源多模态大模型Qwen3-Omni强势登顶

Qwen3-Omni技术突破

核心能力

  • 多模态处理:支持文本、图像、语音、视频四种数据类型
  • 人类化交互:具备"听、说、写"类人能力
  • 性能表现:在音视频能力方面获得32个最佳性能SOTA

技术亮点

  1. 行业首创:在保持单模态文本和图像任务稳定性能的同时,实现强大的音视频能力
  2. 效率提升:单一模型即可完成以往需要多个模型协作的复杂指令
  3. 用户体验:全面提升AI交互体验

应用场景

  • 汽车系统
  • 智能眼镜
  • 移动设备

通义大模型家族全面开花

在2025云栖大会上发布的7款模型中,除Qwen3-Omni外,还包括:

  1. 视觉理解模型:Qwen3-VL
  2. 图像编辑模型:Qwen-Image-Edit-2509
  3. 动作生成模型:Wan2.2-Animate
  4. 深度研究Agent模型:DeepResearch

行业其他重要动态

深度求索动态

  • DeepSeek疑似发布V3.2版本
  • 模型命名空间短暂出现在Hugging Face后被移除

蚂蚁集团创新

  • 开源高性能思维模型Ring-flash-2.0
  • 在多项挑战性基准测试中表现优异
  • 兼具强大计算能力和资源效率

谷歌视觉突破

  • Veo3视频生成模型展现多任务处理潜力
  • 具备零样本学习能力
  • 被视为视觉AI的里程碑时刻

阿里云安全布局

  • 推出首款安全模型Qwen3Guard
  • 基于Qwen3微调优化
  • 专注于检测输入输出中的风险

行业趋势观察

  1. 多模态融合成为大模型发展主要方向
  2. 开源生态竞争日趋激烈
  3. 安全防护成为模型部署重要考量
  4. 应用场景不断拓展至终端设备

注:本文基于2025年9月29日AIbase Daily内容整理

火龙果频道