软件范式的重塑：Andrej Karpathy解读AI时代的新代码与新操作系统

Andrej Karpathy的最新演讲深刻阐释了“软件3.0”时代，其中自然语言提示词正取代传统代码成为核心编程范式，大语言模型（LLM）则被视为新一代操作系统。他强调了人机协作的重要性，呼吁软件界面适应AI的“感知”与“行动”，并对AI代理的成熟路径持谨慎乐观态度。

作为前特斯拉AI总监、OpenAI的明星研究员，Andrej Karpathy总是能以其独到的视角和深邃的思考，在人工智能领域投下掷地有声的涟漪。近日，Karpathy在YC AI创业学校的演讲引发了业界广泛关注，他不仅重申了“软件3.0”的愿景，更将大语言模型（LLM）提升至“新操作系统”的地位，揭示了AI时代编程范式、计算平台乃至人机交互的深刻变革。

软件范式的演进：从代码到“咒语”

Karpathy的论述始于对软件发展史的宏大叙事：从依赖人类手动编写指令的软件1.0时代，到以数据投喂为核心、机器从中学习模式的软件2.0时代，我们正迈入一个全新的纪元——软件3.0。在这个新范式中，自然语言提示词（prompts）不再仅仅是与模型交流的工具，它们被赋予了“新代码”的地位。这标志着编程方式的根本性转变：过去需要人类工程师一行行敲打的复杂逻辑，如今可以由AI通过“对模型说咒语”的方式自动生成和执行¹。

这种转变的力量不容小觑。正如Karpathy本人所示范的，他可以在没有任何Swift编程经验的情况下，仅凭与ChatGPT的多轮对话，在一个小时内开发并部署一个完整的卡路里追踪iOS应用²。这不仅仅是效率的提升，更是编程门槛的颠覆性降低，预示着未来“氛围编程师”的崛起——那些能够巧妙构建和引导AI、而非亲自动手编写底层代码的开发者。这意味着，过去由人工编写的复杂逻辑正逐渐被大模型所承载和自动化，将人类的创造力从繁琐的语法细节中解放出来，专注于更高层次的抽象和问题定义。

LLM作为新操作系统：重塑计算平台

在Karpathy看来，将LLM比作“操作系统”（Operating Systems）远比将其视为“电网”或“芯片工厂”更为贴切。LLM并非电力或自来水那样标准化、无差异的“商品”，它们是日益复杂的软件生态系统，具备独特的复杂性、能力边界和生态系统特征。他精妙地将闭源的LLM提供商类比为Windows和macOS，而将开源的Llama生态视为Linux。更进一步地，他提出将LLM本身视为计算机体系结构中的“CPU”，负责执行计算和推理的核心任务；而**上下文窗口（Context Windows）**则如同“内存（RAM）”，临时存储当前工作所需的信息¹。在这种类比下，LLM的工作流就是调度这些“硬件”资源以解决用户提出的复杂任务，从而构成一个全新的计算平台。

然而，Karpathy也明确指出，当前主流的纯文本聊天框式交互方式并非长久之计。他以代码编辑器Cursor为例，指出通过图形用户界面（GUI）直观地展示代码增删、并通过快捷键快速接受或拒绝，远比用自然语言描述修改要高效得多。这突显了GUI在“验证”和“审计”AI工作成果中的关键作用，它利用了人类强大的视觉处理能力，使得人机协作的“生成-验证”循环能够飞速运转。尽管LLM的核心是语言模型，但要构建出真正实用的、能部分自主的应用，决不能忽视GUI的力量，它是连接人类用户和AI“操作系统”之间最高效的桥梁。

从愿景到现实：AI代理的挑战与人机协作的未来

Karpathy对AI代理（agents）的看法，既充满远见又秉持着谨慎的现实主义。他认为，当前普遍高呼的“agent元年”是过于乐观的，这更应该被视为“代理人的十年（decade of agents）”¹。从一个令人惊艳的演示（99%的成功率）到真正可靠、能处理所有极端情况的成熟产品（99.999%的成功率），其间横亘着一道漫长而艰难的鸿沟。

为了实现软件向“AI可驱动的、部分自主的应用”的改造，Karpathy提出了三个前提条件：

感知（Perception）：AI代理必须能够“看到”所有人类用户能看到的信息。
行动（Action）：AI代理必须能够执行所有人类用户能执行的操作。
监督（Supervision）：必须有一个机制，允许人类监督AI的工作并随时介入，因为AI系统目前远非完美可靠¹。

一个至关重要的结论是，当前绝大多数软件的用户界面（如各种开关和设置）都是纯粹为人类设计的，这恰恰是实现AI自动化的主要障碍。因此，他呼吁：“所有这一切都必须改变，变得对大语言模型可访问”¹。这意味着未来的软件设计不仅要考虑人机交互，更要考虑如何让AI能有效“理解”和“操作”界面。

Karpathy还深入探讨了LLM所展现出的“心理特征”。他指出，AI通过学习和拟合互联网上几乎所有人类编写的文本数据进行训练，因此不可避免地涌现出类似人类的心理特质，无论好与坏。LLM拥有百科全书般的知识储备，犹如电影《雨人》中的主角，但也伴随着幻觉、智能水平参差不齐以及类似“顺行性遗忘症”般的有限记忆能力等认知缺陷¹。

他以教育为例强调了人类监督和结构化的重要性。一个完全开放、无结构的指令会让AI“失控”或“迷失方向”，无法提供连贯的教学大纲。因此，他提倡让教师与AI协作，共同创建结构化的“课程”，这个可被审核和验证的中间产物，能确保教学质量，避免“过度反应的代理”产生无用结果。

有趣的是，Karpathy也观察到LLM颠覆了传统的技术扩散方向。以往，颠覆性技术往往先由政府和企业采用，再逐步普及到消费者。但LLM却恰恰相反，它首先通过ChatGPT等消费级应用触达大众，而政府和企业在采用上反而显得滞后¹。这独特的扩散模式，无疑为行业带来了前所未有的机遇和挑战。

Andrej Karpathy的演讲不仅是一次技术分析，更是一场关于AI时代人类与机器如何协同进化的深刻思考。他没有描绘不切实际的“大饼”，而是提供了多维度的新视角和一种不断自我迭代的思维方式。在每个人都在努力穿上“AI战甲”的当下，他为我们指明了未来软件开发、人机交互以及AI部署的可能路径，强调了在追求自动化的同时，人类的监督、协作与对AI局限性的深刻理解将是成功的关键。

引用

AI大神Karpathy演讲刷屏：软件3.0时代已来，提示词就是新代码·APPSO·发现明日产品的（2025/6/20）·检索日期2025/6/20 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
AI 大神 Karpathy 演讲刷屏：软件 3.0 时代已来，提示词就是新代码 | 附完整PPT_腾讯新闻·腾讯新闻·（2025/6/20）·检索日期2025/6/20 ↩︎