蚂蚁集团开源全球首个混合线性架构万亿参数思考模型 Ring-2.5-1T
发布日期:2026年2月13日
来源:AIbase
核心摘要
2026年2月13日,蚂蚁集团正式开源了全球首个基于混合线性架构的万亿参数推理模型 Ring-2.5-1T。该模型在长文本生成、数学推理和智能体(Agent)任务执行方面达到了开源领先水平,旨在为智能体时代的复杂任务处理提供高性能基础支持。
关键性能与突破
1. 生成效率显著提升
- 长文本生成优化:在超过32K的长文本生成场景中,Ring-2.5-1T的内存访问量相比上一代模型降低超过10倍,吞吐量提升超过3倍。
- 效率随长度增长:模型在长序列推理任务中的吞吐量优势,随着生成文本长度的增加而持续扩大。
2. 深度思考能力卓越
- 数学竞赛水平:在自测的国际数学奥林匹克(IMO2025)和中国数学奥林匹克(CMO2025)中,模型达到了金牌水平(IMO 35分,CMO 105分)。
- 智能体框架适配:能够轻松适配Claude Code、OpenClaw个人AI助手等智能体框架,支持多步骤规划和工具调用。
3. 基准测试表现领先
在多项权威基准测试中,Ring-2.5-1T与DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking、Claude-Opus-4.5-Extended-Thinking等主流开源及闭源模型进行了系统对比,结果如下:
- 高难度推理场景:在数学推理、代码生成、逻辑推理、智能体任务执行等场景达到开源领先水平。
- 特定模式优势:在“深度思考”(Heavy Thinking)模式下,于IMOAnswerBench、HMMT-25等数学竞赛推理基准,以及LiveCodeBench-v6代码生成基准上,超越了所有对比模型,展现出强大的复杂推理与跨任务泛化能力。
技术架构创新
- 基础架构:模型基于Ling2.5架构,通过优化注意力机制,显著提升了长文本推理的效率和稳定性。
- 参数规模:激活参数量从上一代的510亿(51B)提升至630亿(63B)。
- 效率对比:在总参数量达到1万亿(1T)的情况下,相比仅激活320亿参数(32B)的KIMI K2架构,Ling2.5架构在长序列推理任务的吞吐量上仍显示出显著优势。
行业意义与影响
- 解决痛点:随着AI大模型应用从短对话扩展到长文档处理、跨文件代码理解和复杂任务规划,Ring-2.5-1T有效缓解了长输出场景下计算成本高、推理速度慢的问题。
- 展示综合实力:该模型的开源反映了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程实现方面的综合能力。
- 提供新选择:为行业在智能体时代提供了高性能、高效率基础模型的新选择。
发布与获取
目前,Ring-2.5-1T的模型权重和推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台的Chat体验页面和API服务即将上线。
注:本文根据AIbase发布的新闻材料整理,已移除广告、推广链接及无关的导航信息,聚焦于核心产品发布内容。文中提及的其他公司及产品动态(如MiniMax、智谱GLM-5、DeepSeek更新等)为原文附带的其他新闻条目,未纳入本整理稿主体。
