Andrej Karpathy的最新演讲揭示了软件开发正迈入“软件3.0”时代,其中自然语言编程和大型语言模型将成为核心。这场范式转变不仅重塑了编程的本质,也预示着AI将作为新型操作系统与基础设施,深刻影响社会与人机交互模式,要求我们重新思考软件设计与构建方式。
在瞬息万变的AI浪潮中,前特斯拉AI总监、OpenAI早期成员Andrej Karpathy的洞见向来具有风向标意义。近日,他在旧金山AI创业学校的演讲引发了技术圈的广泛热议,其核心观点直指一场正在发生的“编程革命”——我们正从传统代码、神经网络权重走向以自然语言为核心的“软件3.0”时代,一个需要我们重写和重新设计一切的时代。12
软件演进:从精准指令到语义化理解
Karpathy的论述始于对软件发展历程的清晰界定。他将我们所熟知的、由C++等编程语言编写的精确指令代码定义为**“软件1.0”。这是一个逻辑严谨、确定性强的世界。随后,随着深度学习的兴起,他提出了“软件2.0”**的概念,其本质是神经网络的权重参数。开发者不再直接编写逻辑,而是通过调整数据集、运行优化器来训练模型,让模型从数据中学习规律。Hugging Face的兴起,正是软件2.0时代代码仓库(GitHub)的写照,模型参数的微调如同“git commit”般迭代着功能。1
然而,当前最大的根本性变化,源于大语言模型(LLMs)的崛起,它催生了**“软件3.0”**。在这一范式下,编程接口不再是Python代码或神经网络训练,而是我们日常使用的“英语”——或者说,自然语言提示词(Prompt)。通过简单的语言指令,大模型便能承担起过去需要人工编写的复杂逻辑。Karpathy以情感分类为例,形象地展示了从编写Python脚本到训练神经网络,再到直接通过Prompt让LLM完成任务的演变。这种转变,将人机交互的语言障碍彻底消除,预示着一个编程门槛大幅降低的时代。1
Karpathy援引他在特斯拉自动驾驶系统开发的经验,进一步阐释了这种“吞噬”效应。早期自动驾驶系统中,“一吨”的C++代码(软件1.0)与日渐增长的神经网络(软件2.0)并存。随着神经网络能力的增强,大量原本由C++编写的逻辑代码被逐步删除,由2.0堆栈“吞噬”并取代。他预测,软件3.0堆栈正在以同样的速度向整个技术栈渗透,未来开发者将持续面临抉择:某个功能是该用1.0(代码)、2.0(训练模型),还是3.0(LLM Prompt)来实现?这要求未来的从业者对这三种范式都需熟练掌握并灵活切换。1
LLM的本质:基础设施、操作系统与“人类精神”
为了更好地驾驭软件3.0,Karpathy深入探讨了LLM的本质,提出了一系列引人深思的类比。
首先,LLM被视为一种**“新电力”,具备公共基础设施**的属性。OpenAI、Google Gemini、Anthropic等LLM实验室投入巨额资本(CapEx)训练模型,如同建设电力网络;随后通过API以按token计费的方式“供电”,这便是运营支出(OpEx)。这种模式要求低延迟、高可用、服务质量稳定。当顶尖LLM发生故障时,社会工作受到影响,仿佛经历了一场“智能停电”,这凸显了我们对其日益增长的依赖性。1
其次,LLM也具有**“晶圆厂”的特征,训练过程涉及巨大的高强度研发投资,技术秘密正在快速集中于少数几家实验室。然而,Karpathy认为最贴切的类比是:LLM更像操作系统**。它们不再是简单的商品,而是日益复杂的软件生态系统,拥有封闭源(如GPT、Claude)和开源替代品(如LLaMA),正如Windows/macOS与Linux。LLM如同新型CPU,上下文窗口是内存,负责调度资源、调用能力,这与操作系统的职能高度相似。13
当前的LLM部署模式,也让人联想到20世纪60年代的**分时大型机(time-sharing mainframes)**时代。由于计算资源昂贵,模型集中部署在云端,用户作为“瘦客户端”通过网络接入。每个人都没有完整控制权,只能“时间共享”地使用。虽然个人电脑化的早期迹象已显(如Mac Mini运行某些LLM模型),但LLM至今仍缺乏一个“跨任务通用GUI”,人机交互仍停留在纯文本终端界面,这预示着巨大的创新机会。13
然而,LLM与传统技术扩散路径的最大不同,是其颠覆式的扩散模式。历史上的革命性技术如电力、计算、互联网,总是从政府或大型企业开始,再逐步普及到消费者。但LLM恰好相反:它首先服务于普通用户,从“教我煮鸡蛋”这样的日常需求开始,政府和企业反而落后于消费者的采用速度。这种“自下而上”的扩散路径,或许预示着真正的“杀手级应用”将从个人用户端涌现。13
在探讨LLM的“心理学”时,Karpathy将其比喻为**“人类精神的随机模拟”。它们通过海量互联网文本训练,展现出百科全书般的知识和惊人的记忆力(“雨人”类比)。然而,这些“超能力”伴随着明显的“认知缺陷”。LLM容易“幻觉”(凭空编造内容)、对自身知识模型理解不足,并表现出“锯齿状的智能”——在某些领域超凡,在另一些方面却犯低级错误(如数字大小判断、拼写错误)。更重要的是,它们存在“顺行性遗忘”(Anterograde Amnesia)**,即上下文窗口更像“工作记忆”,它们不会像人类一样自动积累长期知识并变得更聪明(“记忆碎片”/“初恋50次”类比)。此外,提示注入等安全问题也凸显了它们的“轻信”特质。1
构建“钢铁侠战衣”:AI应用的机遇与挑战
面对LLM的超能力与认知缺陷,Karpathy强调了如何有效编程这些系统、避开局限并发挥优势。他最感兴趣的是**“部分自主应用”**。成功的LLM应用,如编程助手Cursor和信息检索工具Perplexity,都具备共性:
- 保留传统界面与人工控制: 人类仍可手动完成任务,LLM集成以处理更大块任务。
- 上下文管理与多轮调用编排: 应用在底层自动处理复杂LLM调用和信息流。
- 专用GUI的重要性: 纯文本交互效率低下,GUI能通过可视化(如代码diff的红绿标记)提高人类审阅不完美系统的效率。
- “自主滑块”(Autonomy Slider): 用户可以根据任务复杂度,选择赋予LLM不同程度的自主权,从轻量补全到全局修改。13
这些应用的核心在于人机协作模式的转变:AI生成,人类验证。因此,优化这个“生成-验证循环”的速度至关重要。GUI通过利用人类视觉能力加速验证,而**控制AI行为的范围(“牵好绳子”)**则确保人类作为“瓶颈”能够有效监督。Karpathy告诫,过于激进的Agent(如一次性生成万行代码)并不实用,因为人类的验证成本极高。他本人在AI辅助编程时,倾向于小步快跑,确保每次修改的安全性和可控性。1
他以特斯拉自动驾驶12年仍未完全实现自主的例子,对当前业界“2025是Agent元年”的浮躁预期表达了担忧。他认为这更像**“Agent的十年”,需要缓慢推进,让人始终在环中,秉持着构建“钢铁侠战衣”(增强工具)而非“机器人”(全自动Agent)**的心态。产品应从一开始就包含“自主滑块”,并思考如何逐步提升自主程度,这才是长期成功的关键。1
颠覆式扩散:从“vibe coding”到“Agent-Native”软件
LLM带来的另一大机遇,是编程的民主化。自然语言成为编程接口,意味着几乎所有人都可以“编程”。Karpathy创造的“vibe coding”一词意外走红,描绘了一种轻松、直观的编程体验。他分享的儿童通过“vibe coding”创造的视频,展现了这种变革的积极前景,预示着这将成为下一代人接触软件开发的“网关药物”。14
为了适应LLM这一全新的数字信息“消费者”和“操作者”类别,我们的软件基础设施也需要调整。Karpathy提出像robots.txt
一样,可以创建一个**llm.txt
文件**,用LLM友好的markdown格式向LLM说明网站内容,这比LLM解析复杂HTML效率更高。他赞扬了Vercel和Stripe等公司将技术文档转化为更适合LLM阅读的markdown格式,甚至将“点击这里”的指令替换为curl
命令,使LLM代理能够直接执行。1
此外,一些小工具,如将GitHub仓库转换为LLM可读大文本的get.ingest
,以及为仓库自动生成文档页面的Deep Wiki,都展示了如何“桥接”LLM与现有信息之间的能力落差。Karpathy坚信,未来即便LLM能“自己动手”点击网页,我们也应该主动“迎合”它们,让信息更易于访问和理解。这不仅能降低当前高昂的LLM使用成本,也能解锁海量的实际应用。1
总而言之,Karpathy的演讲为我们描绘了一个充满变革与机遇的未来图景。LLM作为基础设施和操作系统,正引领我们回到计算的“1960年代”,但它们同时也是具备缺陷的“人类灵魂”。这要求我们重新审视软件构建,以“钢铁侠战衣”的哲学打造“部分自主产品”,优化人机协作循环,并为新兴的Agent构建“Agent-Native”的数字环境。这是一个充满挑战,却也无比激动人心的黄金时代,需要我们专业开发者与LLM共同书写新的篇章。1
References
-
Andrej Karpathy(2025/6/19)。Andrej Karpathy 爆火演讲刷屏技术圈:AI开启软件 3.0,重写一切的时代来了。36氪。检索日期2025/6/19。 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Andrej Karpathy(2025/6/19)。Karpathy最新演讲刷屏:别再说2025是Agent元年了,这段路还要走10年_生成式 AI_InfoQ精选文章。InfoQ。检索日期2025/6/19。 ↩︎
-
Andrej Karpathy(2025/6/19)。YC AI 创业营第一天,Andrej Karpathy 的演讲刷屏了 - 每时AI。每时AI。检索日期2025/6/19。 ↩︎ ↩︎ ↩︎ ↩︎
-
Andrej Karpathy(2025/6/19)。大神Karpathy再谈氛围编程!AI开启软件重写潮!做通用Agent是炫技,所有AI应用要向Cursor学习-AI.x-AIGC专属社区 …。51CTO。检索日期2025/6/19。 ↩︎