AI-NEWS · 2025年 9月 30日

Ant Bank开源高性能思维模型

蚂蚁银行开源高性能思维模型Ring-flash-2.0

模型概述

蚂蚁百灵大模型团队于2025年9月29日正式开源发布最新高性能推理模型——Ring-flash-2.0。该模型是基于Ling-flash-2.0-base深度优化的版本,在人工智能领域实现了重要突破。

核心技术特点

参数配置

  • 总参数量:100亿参数
  • 激活参数:每次推理仅激活6.1亿参数
  • 效率优势:通过高效激活机制,在提供强大计算能力的同时显著节省资源

性能表现

在多项具有挑战性的基准测试中表现优异,包括:

  • 数学竞赛
  • 代码生成
  • 逻辑推理

性能不仅超越同类40亿参数模型,还能与更大规模的开源稀疏模型(MoE)及部分闭源高性能推理模型API竞争。

训练方法创新

团队设计了创新的两阶段强化学习训练流程:

  1. 轻量级长序列思维链监督微调:使模型掌握多种思维方法
  2. 可验证奖励强化学习训练:持续激发模型推理潜力
  3. 人类反馈强化学习阶段:增强模型通用能力

开源内容

Ring-flash-2.0将完全开源以下内容:

  • 模型权重
  • 强化学习训练方案
  • 数据配方

开发者可通过Hugging Face和ModelScope平台获取相关材料。

行业意义

随着AI技术的持续发展,Ring-flash-2.0为未来智能应用开辟了新的可能性,有望在各领域实现广泛应用和进一步突破。

火龙果频道