Yuan3.0Flash：开源多模态基础模型引领AI新浪潮

发布日期：2025年12月31日
来源：AIbase Daily

核心摘要

近日，YuanLab.ai团队正式发布了开源多模态基础模型Yuan3.0Flash。该模型参数规模达400亿（40B），采用创新的稀疏专家混合架构，在推理时仅激活约37亿参数，实现了“更低算力，更高智能”的理念。模型在多项企业级任务中表现超越GPT-5.1，同时显著降低了应用成本。

参数规模：400亿（40B）。
核心架构：采用稀疏专家混合架构，推理时仅激活约37亿参数，大幅降低算力消耗。
训练方法：引入强化学习训练方法及反思抑制奖励机制，有效减少无效反思，提升性能。
结构组成：
- 视觉编码器：将视觉信号转换为token。
- 语言主干网络：采用局部过滤增强注意力结构与MoE结构，保证注意力精度的同时降低训练与推理算耗。
- 多模态对齐模块：实现高效的跨模态特征对齐。

企业场景优势：在RAG、多模态检索、多模态表格理解等任务中，表现超越GPT-5.1。
多模态与语言推理：在准确率上接近更大规模模型（如Qwen3-VL-235B、DeepSeek-R1-671B），但token消耗仅为后者的1/4至1/2，为企业有效降本。
成本效益：在达到相近性能的同时，显著降低了推理所需的计算资源与成本。

Yuan3.0系列将发布多个版本，形成完整的产品矩阵：

小米大模型MiMo公测延期：小米自研大模型MiMo-V2-Flash免费公测期延长20天，至2026年1月20日。该模型参数量3090亿，激活参数150亿，在推理与代码生成方面表现优异。
MiniMax开源编程模型：MiniMax开源M2.1编程模型，已上架Hugging Face、ModelScope及GitHub，支持vLLM实现高效推理。
具身智能新品牌发布：苏州乐想科技发布具身智能品牌“原点智能”，并推出首款全尺寸人形机器人原型机。
腾讯开源3D动作生成器：腾讯幻影团队开源HY-Motion1.0模型，基于DiT架构与流匹配技术，可从文本描述生成高质量3D骨骼动画。
罗永浩推出AI听书产品：罗永浩创业公司“细红线”推出AI产品“切听”，定位深度语音听书库，可提供1-2小时、超万字的深度解读。
多模态大模型最新评测：SuperCLUE-VLM榜单显示，谷歌Gemini-3-Pro以83.64分大幅领先；国内模型中，SenseNova V6.5Pro与豆包表现突出。
阿里通义实验室发布GUI智能体：通义实验室发布MAI-UI多模态GUI智能体家族，在通用与移动GUI导航任务中表现超越多个竞品。
腾讯云公布金融AI成果：2025年与上交所、深交所、建行、工行等机构合作，落地超100个大模型场景，金融AI进入深度实施阶段。
政策动态：2026年“两新”政策升级，首次将智能眼镜、手环等AI产品纳入以旧换新补贴范围。

本文由AIbase Daily团队整理，聚焦AI前沿动态与技术趋势。