AI-NEWS · 2026年 1月 1日

元像3.0引领AI新浪潮

Yuan3.0Flash:开源多模态基础模型引领AI新浪潮

发布日期:2025年12月31日
来源:AIbase Daily

核心摘要

近日,YuanLab.ai团队正式发布了开源多模态基础模型Yuan3.0Flash。该模型参数规模达400亿(40B),采用创新的稀疏专家混合架构,在推理时仅激活约37亿参数,实现了“更低算力,更高智能”的理念。模型在多项企业级任务中表现超越GPT-5.1,同时显著降低了应用成本。

模型详情

1. 技术架构与创新

  • 参数规模:400亿(40B)。
  • 核心架构:采用稀疏专家混合架构,推理时仅激活约37亿参数,大幅降低算力消耗。
  • 训练方法:引入强化学习训练方法及反思抑制奖励机制,有效减少无效反思,提升性能。
  • 结构组成
    • 视觉编码器:将视觉信号转换为token。
    • 语言主干网络:采用局部过滤增强注意力结构与MoE结构,保证注意力精度的同时降低训练与推理算耗。
    • 多模态对齐模块:实现高效的跨模态特征对齐。

2. 性能表现

  • 企业场景优势:在RAG、多模态检索、多模态表格理解等任务中,表现超越GPT-5.1
  • 多模态与语言推理:在准确率上接近更大规模模型(如Qwen3-VL-235B、DeepSeek-R1-671B),但token消耗仅为后者的1/4至1/2,为企业有效降本。
  • 成本效益:在达到相近性能的同时,显著降低了推理所需的计算资源与成本。

3. 开源与生态

  • 发布内容:包含16位和4位模型权重、详细技术报告及训练方法。
  • 社区支持:支持社区二次开发与行业定制,推动AI技术普及。

未来规划

Yuan3.0系列将发布多个版本,形成完整的产品矩阵:

  • Flash版:400亿参数(已发布)。
  • Pro版:2000亿参数。
  • Ultra版:1万亿参数。

其他AI快讯摘要(2025年12月31日)

  1. 小米大模型MiMo公测延期:小米自研大模型MiMo-V2-Flash免费公测期延长20天,至2026年1月20日。该模型参数量3090亿,激活参数150亿,在推理与代码生成方面表现优异。
  2. MiniMax开源编程模型:MiniMax开源M2.1编程模型,已上架Hugging Face、ModelScope及GitHub,支持vLLM实现高效推理。
  3. 具身智能新品牌发布:苏州乐想科技发布具身智能品牌“原点智能”,并推出首款全尺寸人形机器人原型机。
  4. 腾讯开源3D动作生成器:腾讯幻影团队开源HY-Motion1.0模型,基于DiT架构与流匹配技术,可从文本描述生成高质量3D骨骼动画。
  5. 罗永浩推出AI听书产品:罗永浩创业公司“细红线”推出AI产品“切听”,定位深度语音听书库,可提供1-2小时、超万字的深度解读。
  6. 多模态大模型最新评测:SuperCLUE-VLM榜单显示,谷歌Gemini-3-Pro以83.64分大幅领先;国内模型中,SenseNova V6.5Pro与豆包表现突出。
  7. 阿里通义实验室发布GUI智能体:通义实验室发布MAI-UI多模态GUI智能体家族,在通用与移动GUI导航任务中表现超越多个竞品。
  8. 腾讯云公布金融AI成果:2025年与上交所、深交所、建行、工行等机构合作,落地超100个大模型场景,金融AI进入深度实施阶段。
  9. 政策动态:2026年“两新”政策升级,首次将智能眼镜、手环等AI产品纳入以旧换新补贴范围。

本文由AIbase Daily团队整理,聚焦AI前沿动态与技术趋势。

火龙果频道