Yuan3.0Flash:开源多模态基础模型引领AI新浪潮
发布日期:2025年12月31日
来源:AIbase Daily
核心摘要
近日,YuanLab.ai团队正式发布了开源多模态基础模型Yuan3.0Flash。该模型参数规模达400亿(40B),采用创新的稀疏专家混合架构,在推理时仅激活约37亿参数,实现了“更低算力,更高智能”的理念。模型在多项企业级任务中表现超越GPT-5.1,同时显著降低了应用成本。
模型详情
1. 技术架构与创新
- 参数规模:400亿(40B)。
- 核心架构:采用稀疏专家混合架构,推理时仅激活约37亿参数,大幅降低算力消耗。
- 训练方法:引入强化学习训练方法及反思抑制奖励机制,有效减少无效反思,提升性能。
- 结构组成:
- 视觉编码器:将视觉信号转换为token。
- 语言主干网络:采用局部过滤增强注意力结构与MoE结构,保证注意力精度的同时降低训练与推理算耗。
- 多模态对齐模块:实现高效的跨模态特征对齐。
2. 性能表现
- 企业场景优势:在RAG、多模态检索、多模态表格理解等任务中,表现超越GPT-5.1。
- 多模态与语言推理:在准确率上接近更大规模模型(如Qwen3-VL-235B、DeepSeek-R1-671B),但token消耗仅为后者的1/4至1/2,为企业有效降本。
- 成本效益:在达到相近性能的同时,显著降低了推理所需的计算资源与成本。
3. 开源与生态
- 发布内容:包含16位和4位模型权重、详细技术报告及训练方法。
- 社区支持:支持社区二次开发与行业定制,推动AI技术普及。
未来规划
Yuan3.0系列将发布多个版本,形成完整的产品矩阵:
- Flash版:400亿参数(已发布)。
- Pro版:2000亿参数。
- Ultra版:1万亿参数。
其他AI快讯摘要(2025年12月31日)
- 小米大模型MiMo公测延期:小米自研大模型MiMo-V2-Flash免费公测期延长20天,至2026年1月20日。该模型参数量3090亿,激活参数150亿,在推理与代码生成方面表现优异。
- MiniMax开源编程模型:MiniMax开源M2.1编程模型,已上架Hugging Face、ModelScope及GitHub,支持vLLM实现高效推理。
- 具身智能新品牌发布:苏州乐想科技发布具身智能品牌“原点智能”,并推出首款全尺寸人形机器人原型机。
- 腾讯开源3D动作生成器:腾讯幻影团队开源HY-Motion1.0模型,基于DiT架构与流匹配技术,可从文本描述生成高质量3D骨骼动画。
- 罗永浩推出AI听书产品:罗永浩创业公司“细红线”推出AI产品“切听”,定位深度语音听书库,可提供1-2小时、超万字的深度解读。
- 多模态大模型最新评测:SuperCLUE-VLM榜单显示,谷歌Gemini-3-Pro以83.64分大幅领先;国内模型中,SenseNova V6.5Pro与豆包表现突出。
- 阿里通义实验室发布GUI智能体:通义实验室发布MAI-UI多模态GUI智能体家族,在通用与移动GUI导航任务中表现超越多个竞品。
- 腾讯云公布金融AI成果:2025年与上交所、深交所、建行、工行等机构合作,落地超100个大模型场景,金融AI进入深度实施阶段。
- 政策动态:2026年“两新”政策升级,首次将智能眼镜、手环等AI产品纳入以旧换新补贴范围。
本文由AIbase Daily团队整理,聚焦AI前沿动态与技术趋势。
