阿里云“曦颜-SQL”在全球SQL诊断评测榜单中强势夺冠

发布日期：2025年12月5日
来源：AIbase AI新闻

核心摘要

近日，阿里云飞天实验室自主研发的数据分析智能体“曦颜-SQL”（XiYan-SQL）在全球权威SQL诊断评测基准BIRD-CRITIC（亦称SWE-SQL）中表现卓越，成功登顶全部公开榜单，超越国内外多个顶尖团队，创造了SQL诊断与修复的新行业记录。

该基准由学术界与谷歌云联合推出，旨在探究“大语言模型能否解决真实数据库应用中的用户问题”。其特点包括：

曦颜-SQL在本次评测中，于三项重要榜单均取得第一名：

该成绩在跨方言鲁棒性、复杂SQL处理能力、真实问题修复率、分布外泛化性等多个维度获得了权威验证。

曦颜-SQL采用了多项创新方法以确保其高性能：

模式过滤：优化数据库结构理解。
多生成器集成：融合不同生成策略。
候选重组与最优选择：从多个候选方案中挑选最佳SQL。
这些技术使模型不仅能生成高质量SQL，还能充分考虑语句的可执行性与可维护性，使其能够在存在脏数据、异构模式、跨方言差异的真实系统中提供高可用的诊断与修复方案。

基于曦颜-SQL技术构建的生成式商业智能（GBI）产品“曦颜”（XiYan），已在阿里云百炼平台上线，提供SQL生成与诊断服务。