蚂蚁数科这波操作“野”了!AI“数据翻译官”开源,碾压谷歌登顶,普通人也能C位出道问数据?!

温故智新AIGC实验室

TL;DR:

蚂蚁数科把自家“顶流”数据智能体Agentar SQL开源了,这玩意儿不仅在权威榜单上把Google都甩在身后,还让咱普通人也能像跟Siri聊天一样查数据,简直是企业版“数据自由”的节奏,搞得数据分析师们都开始焦虑了。

最近,科技圈又扔出了一枚“王炸”!蚂蚁数科大手一挥,把自己家的“数据分析智能体”—— Agentar SQL 的核心技术,包括论文、代码、模型和使用指南,统统给开源了1。这波操作,直接把一众吃瓜群众震得虎躯一震,纷纷表示:“好家伙,这不就是把‘降维打击’的技术免费送了吗?!”

咱就是说,这“智能体”到底神在哪儿?

想象一下,你是个金融小白,老板突然让你分析一堆复杂的产品数据,还得结合七七八八的业务规则,搞出个精准的报表。你是不是想哭?别慌,现在有了Agentar SQL,你只需要像跟朋友聊天一样,用大白话提问,比如“上个月销量最好的产品是啥?为啥呢?”,它就能“咻”地一下,帮你把数据从数据库里扒拉出来,变成你想要的答案。

这背后,就是“自然语言转结构化查询语言”(NL2SQL)的神奇魔力。简单来说,Agentar SQL就是个超级懂你的“数据翻译官”,能把人类的“口语化需求”翻译成机器能懂的“SQL代码”,再把结果吐给你。而且,它可不是“野路子”出身,早在今年9月,Agentar-Scale-SQL就已经C位出道,登顶了全球最具权威性的NL2SQL评测基准BIRD-SQL,把Google等一票国内外大厂都甩在身后23

“在BIRD-SQL榜单上,Agentar-SQL不光执行准确率高达81.67%,执行效率也以77分位居榜首,可谓是‘榜首焊死,谁也别想动’。”4

这成绩,可不是昙花一现,它已经持续领跑了两个多月,稳稳地霸占着双榜第一的宝座,简直是AI界的“常胜将军”!在某头部城商行试运营期间,它的查询准确率直接提升了3倍多,平均准确率超92%——这效率,你说气人不气人?

光鲜背后,AI“打工人”的“社畜”困境与“进化论”

话说回来,光是“榜单第一”就够了吗?蚂蚁数科的AI技术负责人章鹏就说了,NL2SQL在实际落地时,简直就是个“社畜打工人”,面临着四大“严峻挑战”

  • 听不懂人话: 人类口语模糊多义,一句话能有八百种理解。
  • 知识储备不足: 行业知识浩如烟海,不是简单的模型“套壳”就能搞定的。
  • 数据库像迷宫: 复杂的数据库结构和关联关系,把AI绕得七荤八素。
  • SQL代码易出错: 生成的SQL语句必须精准无误,否则“差之毫厘,谬以千里”。

就像金融领域的“老法师”们,提问那都是一套一套的,各种复杂业务规则、多条件组合,要是AI听不懂,那可就“白瞎”了。

所以,蚂蚁数科这回开源的,不只是个“能跑会跳”的榜首模型,更是一套着眼未来、面向产业的“进化论”。章鹏强调,除了BIRD-SQL评测的在线扩展能力(Online Scaling),真正能打的“数据智能体”还需要:

  • 离线扩展 (Offline Scaling): 深入理解数据库,把知识结构化,让AI像“学霸”一样,把数据库的“前世今生”都搞清楚。
  • 人机交互 (Human Interaction): 当AI“不确定”时,它会主动跟你“聊聊”,问你到底想干啥,实现“白盒化”和“可纠错”的协作。这不就是AI界的“知心大姐”吗?
  • 自我进化 (Self Evolution): 通过“记忆”优化、工具创建等“免调优”技术,让AI能从错误中“学乖”,不断提升自己,告别对“老妈子式”人工调优的依赖。

蚂蚁数科说了,这些更全面的能力模块,比如理解数据库的Agentar Profiling-SQL、实现免调优进化的Agentar TuningFree-SQL,都会陆续开源,未来可期啊!

商业智能的“王炸”,普通人也能“问数”的时代来了?

全球商业智能市场正以“火箭速度”增长,预计到2025年将达到474.8亿美元1。中国市场更是潜力无限,未来5年复合增长率高达12.7%1。但是,大部分企业目前对商业智能的应用,还停留在“看报表、看大屏”的初级阶段。NL2SQL要大规模落地,就得解决“准确性”和“可用性”这俩老大难问题。

蚂蚁数科Agentar SQL的开源,无疑给整个行业扔下了一颗“深水炸弹”。它不仅降低了企业“玩转”数据的门槛,让非专业人员也能轻松“问数”,更是加速了AI Agent在数据分析领域的普及和进化。这不就是把“数据分析”这件事儿,从精英专属,变成了**普惠大众的“全民运动”**吗?

未来,我们或许真的能看到,每个人都能拥有自己的AI“数据分析师”,随时随地,想问就问。到时候,那些还在苦哈哈写SQL的“码农”们,可能真要考虑转型去搞AI Agent的“保姆”服务了!这波开源,蚂蚁数科不光秀了肌肉,更打开了一个充满想象力的新世界。

引用


  1. 又一数据分析智能体重磅开源,现已登顶BIRD!非专业人员也能轻松查阅和分析数据·InfoQ(2023/12/13)·检索日期2023/12/15 ↩︎ ↩︎ ↩︎

  2. 领跑全球榜单超两月,蚂蚁数科宣布数据智能体关键技术开源·搜狐(2023/12/14)·检索日期2023/12/15 ↩︎

  3. 蚂蚁数科数据分析智能体Agentar-SQL登顶国际权威BIRD榜单·金道营销科技(2023/12/14)·检索日期2023/12/15 ↩︎

  4. 蚂蚁数科Agentar-SQL登顶全球BIRD-Bench榜首 - 人工智能·中关村在线(2023/12/14)·检索日期2023/12/15 ↩︎