AI-NEWS · 2025年 12月 16日

蚂蚁数智开源关键技术

蚂蚁数科开源关键数据智能体技术Agentar SQL,推动企业数据分析平民化

核心事件

2025年12月13日,在第二届CCF中国数据大会上,蚂蚁数科宣布将其关键数据智能体技术 Agentar SQL 全面开源,内容涵盖所有论文、代码、模型及用户指南。该技术旨在让非专业人士通过日常语言进行业务数据查询与分析,为企业数字化提供更精准、可用的智能数据分析基础。

技术详情与开源计划

  • 首期开源内容:一个实时文本转结构化查询语言(Text-to-SQL)框架,为开发者提供开箱即用的数据查询解决方案,提升文本到数据库查询的交互效率。
  • 未来开源路线图:蚂蚁数科计划在2026年,逐步开源数据库理解与挖掘行业知识挖掘以及实时多轮交互技术等框架,覆盖从意图理解、业务理解到数据理解的全数据能力链。

性能表现与行业认可

  1. 试点成果:在某大型城市商业银行的试点运行中,Agentar SQL 多项工具的平均查询准确率超过92%,是传统查询方案的三倍以上。
  2. 国际基准测试领先:2025年9月25日,基于该技术的蚂蚁数科数据分析智能体 Agentar-Scale-SQL,在全球最权威的自然语言转SQL(NL2SQL)评估基准 BIRD-SQL 上位列榜首,超越了谷歌等多家国内外厂商。
    • 持续领先:截至2025年12月,该智能体在BIRD-SQL的准确率与执行效率排名中仍保持第一,已持续领先超过两个月。
    • 基准难度:BIRD-SQL数据集覆盖金融、电力、医疗等37个真实行业场景,包含33GB数据与超1万项高复杂度查询任务,是全球最具挑战性的NL2SQL测试。

市场背景与行业挑战

  • 市场规模
    • 全球商业智能市场预计在2025年达到 474.8亿美元
    • 中国商业智能与分析软件市场预计在2025年达到 12亿美元,并预计到2028年增长至 17.9亿美元,五年复合年增长率(CAGR)为 12.7%
  • 应用现状:目前中国企业使用商业智能产品多集中于数据可视化及报表、仪表盘、数据大屏等简单分析需求。
  • 核心挑战:在真实生产环境中,如何在保持高准确率的同时提升易用性,是NL2SQL技术大规模落地面临的普遍难题。

技术落地面临的四大挑战

蚂蚁数科AI技术负责人张鹏指出,NL2SQL在实际落地中面临四大严峻挑战:

  1. 理解人类模糊、多义的表述。
  2. 注入海量的行业专业知识。
  3. 解析复杂的数据库结构与关系。
  4. 生成准确无误的复杂SQL语句。

这意味着简单的模型“套壳”远不能满足企业级应用对可靠性和准确性的要求。

构建工业级数据智能体的能力栈

张鹏强调,要真正实现工业可用的NL2SQL或数据智能体技术,必须构建更完整的能力栈,除在线伸缩(Online Scaling)能力外,还需:

  1. 离线伸缩(Offline Scaling):深度理解数据库,实现知识结构化。
  2. 人机交互(Human Interaction):智能体能够识别自身的不确定性,主动澄清用户意图,实现透明协作与纠错。
  3. 自我进化(Self Evolution):通过“记忆”优化、工具(如UDF)的创建与复用等“免调优”技术,使智能体能够从错误中学习、持续改进,降低对大量标注数据和专家调优的依赖。

蚂蚁数科计划逐步开源这些更全面的能力模块,例如用于理解数据库的 Agentar Profiling-SQL,以及用于免调优进化的 Agentar TuningFree-SQL。目前,首期在线伸缩框架 Agentar-Scale-SQL 已在 arXiv、GitHub、ModelScope、Hugging Face 等平台发布,并迅速吸引了开发者的关注。

火龙果频道