蚂蚁银行开源高性能思维模型Ring-flash-2.0
模型概述
蚂蚁百灵大模型团队于2025年9月29日正式开源发布最新高性能推理模型——Ring-flash-2.0。该模型是基于Ling-flash-2.0-base深度优化的版本,在人工智能领域实现了重要突破。
核心技术特点
参数配置
- 总参数量:100亿参数
- 激活参数:每次推理仅激活6.1亿参数
- 效率优势:通过高效激活机制,在提供强大计算能力的同时显著节省资源
性能表现
在多项具有挑战性的基准测试中表现优异,包括:
- 数学竞赛
- 代码生成
- 逻辑推理
性能不仅超越同类40亿参数模型,还能与更大规模的开源稀疏模型(MoE)及部分闭源高性能推理模型API竞争。
训练方法创新
团队设计了创新的两阶段强化学习训练流程:
- 轻量级长序列思维链监督微调:使模型掌握多种思维方法
- 可验证奖励强化学习训练:持续激发模型推理潜力
- 人类反馈强化学习阶段:增强模型通用能力
开源内容
Ring-flash-2.0将完全开源以下内容:
- 模型权重
- 强化学习训练方案
- 数据配方
开发者可通过Hugging Face和ModelScope平台获取相关材料。
行业意义
随着AI技术的持续发展,Ring-flash-2.0为未来智能应用开辟了新的可能性,有望在各领域实现广泛应用和进一步突破。