TL;DR:
随着AI Agent的崛起,数据基础设施正从“Lakehouse”的统一存储计算走向更深层次的“Agent Ready”新范式。这不仅要求数据具备极致的实时性、低延迟和高效率,更预示着数据系统将成为AI自主决策与行动的基石,重塑企业运营和全球科技竞争格局。
数据基础设施的下一个前沿:从Lakehouse到“Agent Ready”
在数字经济的滚滚洪流中,数据基础设施的演进从未停歇。从传统数仓的规整到数据湖的灵活性,再到“Lakehouse”的融合统一,每一次范式转换都深刻影响着企业的数据战略与成本结构。过去几年,Lakehouse架构作为打破数据“烟囱”的利器,已逐渐从争议走向行业共识1。然而,正如星环科技(StarRocks)的TSC member、镜舟科技CTO张友东所言,随着AI浪潮的汹涌而至,数据分析的需求正经历一次更为深刻的转型:从服务战略层面的“Business Analytics”转向直接嵌入运营环节的“Operational Analytics”,乃至最终支撑AI Agent自动化决策。这标志着数据基础设施的**“Lakehouse时代”正加速向“Agent Ready时代”迈进**,对数据的新鲜度、延时和并发提出了前所未有的要求。
Lakehouse的核心价值在于其统一性,它使得数据无论是在实时场景还是离线场景,都能通过单一引擎进行分析,有效解决了数据冗余、指标口径不一和高昂运维成本等顽疾。StarRocks作为这一趋势的践行者,其产品演进路径便是一个缩影:从聚焦高性能分析的1.0版到增强实时能力的2.0版,再到实现存算分离架构的3.0版,每一步都旨在应对不断升级的实时分析挑战。例如,Pinterest、Fanatics和淘宝闪购等全球知名企业通过采用StarRocks的实时湖仓方案,在广告系统、电商分析等场景中实现了高达50%-90%的延迟下降和成本节约1。这些案例生动地诠释了运营智能所带来的巨大商业价值,而这正是通往“Agent Ready”的必经之路。
4.0版本的核心跃迁:StarRocks如何定义“Agent Ready”
AI Agent,作为大模型能力落地的关键载体,其自主规划、学习和执行任务的能力,正以前所未有的速度推动各行各业的智能化升级。然而,智能体的“智能”并非空中楼阁,其背后离不开一个能够提供高质量、高实时性数据的坚实底座。在AI时代,所有数据基础设施厂商都面临一个根本性的问题:如何在新的AI链条中找到并巩固自己的位置?
张友东给出的答案是:“Agent Ready”——与其盲目追逐上层应用的热点,不如将AI所依赖的最核心、最不变的基础能力做到极致1。他强调,AI Agent对数据的需求是明确且不变的:
- 数据要新鲜:模型需要最新信息才能做出准确判断。
- 访问要快:AI Agent的多轮交互和即时决策不能容忍数据获取的延迟。
- 数据处理要高效:高质量的数据准备是模型训练和推理的基石。
StarRocks即将在10月发布的4.0版本,便将“Agent Ready”作为其核心目标。通过**“Multi-Agent协作辅助数据建模”**的创新实践,StarRocks展示了其对AI时代数据基础设施的深刻理解2。传统的数据建模过程往往依赖专家经验,耗时且易错。StarRocks的方案通过将建表优化流程拆解为数据校验、Profile分析、建表参数推荐等多个子任务,并由不同的Agent协同完成,最终输出优化后的建表语句。这种基于智能体的自动化决策支持,不仅能显著提升效率,还能降低数据团队的专业门槛,在多个真实业务场景中被验证有效。
真正的“AI Agent Ready”并非仅仅提供一个Text-to-SQL接口,它包含更深层次的系统性要求:
- 自然语言接口:无论通过MCP Server还是Text-to-SQL,系统必须能够被AI Agent直接以自然语言调用和理解。
- 实时上下文:AI Agent需要实时获取系统的运行状态、文档信息,以确保决策的准确性和时效性。
- 大规模低延时:AI Agent的多轮、高并发交互要求底层数据系统提供毫秒级的响应能力。
- 数据治理:高质量的底层数据是AI Agent输出高价值结果的前提,数据治理的重要性被提升到新的高度。
这意味着未来的数据系统,将不再只是被动地存储和查询数据,而是要成为AI Agent的主动型“大脑皮层”和“记忆中枢”,提供实时、准确、可理解的上下文信息,并能高效执行AI的指令。
商业格局重塑与全球化竞争策略
“Agent Ready”能力的构建,将深刻影响全球数据基础设施市场的商业格局。它不仅是技术上的突破,更是对市场需求和未来趋势的精准把握。具备“Agent Ready”能力的数据平台,将能够解锁一系列全新的商业模式和应用场景:
- 实时智能驱动的商业新范式:从个性化推荐、欺诈检测到供应链优化、智能客服,AI Agent通过实时数据洞察,能够直接驱动业务运营的自动化和智能化,显著提升效率和用户体验,为企业带来差异化的竞争优势。
- 降低AI应用门槛:通过智能化的数据建模和管理,企业将能够以更低的成本和更高的效率开发和部署AI应用,加速AI在各行业的普及。
在与Snowflake、Databricks等全球巨头的竞争中,StarRocks选择了差异化突围路径1。它不寻求在巨头已占据主导地位的通用数据仓库市场硬碰硬,而是聚焦于对实时分析和查询延时有更高要求的细分市场。通过将核心能力做到极致,例如在高并发、低延时场景下的卓越表现,StarRocks有望首先赢得这些“高要求”客户的青睐,从而实现产品市场契合(PMF),再逐步拓展更大的市场空间。
值得关注的是,StarRocks也持续坚持开源路线1。在最新的大会上,其存算分离涉及的StarRocks OS Multi-warehouse企业级能力正式开源,这不仅能降低企业构建复杂场景的门槛,更有助于构建一个充满活力的开发者社区和商业生态,在开源协作与商业变现之间形成良性循环。在全球科技竞争日益激烈的背景下,开源策略是获取开发者心智、加速技术迭代、并最终形成产业标准的重要途径,尤其在AI时代,与更多开源AI系统集成将成为关键。
超越技术:智能体时代的数据伦理与未来图景
“Agent Ready”的兴起,不仅仅是技术层面的迭代,它还触及了更深层次的哲学思辨。当数据基础设施成为AI Agent自主决策的基石,我们必须审视其对人类社会、工作模式乃至伦理道德的深远影响。AI Agent能够通过自然语言接口与底层数据系统交互,并自动进行数据建模、分析甚至决策,这无疑将极大地解放人类的生产力。然而,随之而来的挑战也显而易见:
- 决策透明性与可解释性:当复杂的多Agent系统基于数据做出决策时,如何确保其决策过程的透明性和可解释性,避免“黑箱操作”?
- 数据偏见与伦理风险:底层数据的质量和治理水平直接决定了AI Agent的输出效果。如果数据本身存在偏见或缺乏有效的治理,Agent的自动化决策可能会加剧社会不公或产生意想不到的伦理问题。
- 未来工作模式的重塑:当数据建模、分析等传统由人类专家执行的任务被AI Agent自动化后,人类的工作重心将如何转移?新的技能需求和就业结构将如何演变?
展望未来3-5年,“Agent Ready”将不再是少数领先企业的专利,而是成为所有致力于AI应用和数字化转型企业的新常态。数据基础设施将与AI平台深度融合,模糊传统的数据层与应用层界限,形成一个高度智能、自适应的统一体。这种融合将推动软件开发范式的革新,使得“AI Native”的应用程序能够直接从“Agent Ready”的数据底座获取智能,从而加速AI普惠化的进程。
StarRocks的实践为我们提供了一个缩影:真正的竞争力不在于短期追逐热点,而在于深耕核心、确定的基础能力。通过打造“Agent Ready”的数据基础设施,我们不仅能解决当下企业对实时性与成本的严峻挑战,更是在为未来AI智能体的全面爆发铺设一条坚实、可靠的高速公路,共同迈向一个由AI Agent深度赋能的全新文明进程。
引用
-
Lakehouse 之后,Agent Ready 成了数据 Infra 的新标配? · InfoQ · (2025/10) · 检索日期2024/07/26 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
(PPT已开放下载)StarRocks Connect 2025 圆满落幕:AI Native 时代 · 镜舟科技论坛 · 张友东 (2025/10) · 检索日期2024/07/26 ↩︎