蚂蚁数科开源关键数据智能体技术Agentar SQL,推动企业数据分析平民化
核心事件
2025年12月13日,在第二届CCF中国数据大会上,蚂蚁数科宣布将其关键数据智能体技术 Agentar SQL 全面开源,内容涵盖所有论文、代码、模型及用户指南。该技术旨在让非专业人士通过日常语言进行业务数据查询与分析,为企业数字化提供更精准、可用的智能数据分析基础。
技术详情与开源计划
- 首期开源内容:一个实时文本转结构化查询语言(Text-to-SQL)框架,为开发者提供开箱即用的数据查询解决方案,提升文本到数据库查询的交互效率。
- 未来开源路线图:蚂蚁数科计划在2026年,逐步开源数据库理解与挖掘、行业知识挖掘以及实时多轮交互技术等框架,覆盖从意图理解、业务理解到数据理解的全数据能力链。
性能表现与行业认可
- 试点成果:在某大型城市商业银行的试点运行中,Agentar SQL 多项工具的平均查询准确率超过92%,是传统查询方案的三倍以上。
- 国际基准测试领先:2025年9月25日,基于该技术的蚂蚁数科数据分析智能体 Agentar-Scale-SQL,在全球最权威的自然语言转SQL(NL2SQL)评估基准 BIRD-SQL 上位列榜首,超越了谷歌等多家国内外厂商。
- 持续领先:截至2025年12月,该智能体在BIRD-SQL的准确率与执行效率排名中仍保持第一,已持续领先超过两个月。
- 基准难度:BIRD-SQL数据集覆盖金融、电力、医疗等37个真实行业场景,包含33GB数据与超1万项高复杂度查询任务,是全球最具挑战性的NL2SQL测试。
市场背景与行业挑战
- 市场规模:
- 全球商业智能市场预计在2025年达到 474.8亿美元。
- 中国商业智能与分析软件市场预计在2025年达到 12亿美元,并预计到2028年增长至 17.9亿美元,五年复合年增长率(CAGR)为 12.7%。
- 应用现状:目前中国企业使用商业智能产品多集中于数据可视化及报表、仪表盘、数据大屏等简单分析需求。
- 核心挑战:在真实生产环境中,如何在保持高准确率的同时提升易用性,是NL2SQL技术大规模落地面临的普遍难题。
技术落地面临的四大挑战
蚂蚁数科AI技术负责人张鹏指出,NL2SQL在实际落地中面临四大严峻挑战:
- 理解人类模糊、多义的表述。
- 注入海量的行业专业知识。
- 解析复杂的数据库结构与关系。
- 生成准确无误的复杂SQL语句。
这意味着简单的模型“套壳”远不能满足企业级应用对可靠性和准确性的要求。
构建工业级数据智能体的能力栈
张鹏强调,要真正实现工业可用的NL2SQL或数据智能体技术,必须构建更完整的能力栈,除在线伸缩(Online Scaling)能力外,还需:
- 离线伸缩(Offline Scaling):深度理解数据库,实现知识结构化。
- 人机交互(Human Interaction):智能体能够识别自身的不确定性,主动澄清用户意图,实现透明协作与纠错。
- 自我进化(Self Evolution):通过“记忆”优化、工具(如UDF)的创建与复用等“免调优”技术,使智能体能够从错误中学习、持续改进,降低对大量标注数据和专家调优的依赖。
蚂蚁数科计划逐步开源这些更全面的能力模块,例如用于理解数据库的 Agentar Profiling-SQL,以及用于免调优进化的 Agentar TuningFree-SQL。目前,首期在线伸缩框架 Agentar-Scale-SQL 已在 arXiv、GitHub、ModelScope、Hugging Face 等平台发布,并迅速吸引了开发者的关注。
