TL;DR:
都别“内卷”了,AI正以光速进化,能力每7个月就翻一番!用不了多久,你可能就要和你的“电子同事”抢饭碗了。2030年,人类工程师几个月的工作,大模型可能几小时就搞定。别问,问就是未来已来,打工人真的要开始“危机公关”了。
AI,这玩意儿最近是真没闲着。以前我们总说它进步神速,但到底有多“速”?最近,一家叫METR的研究机构直接甩出了一个硬核数据:大语言模型(LLM)的智能水平,竟然每7个月就翻一番!这速度,简直比火箭还快,人类的“打工寿命”可能真的要进入倒计时了。你是不是已经开始默默打开招聘软件了?别急,好戏才刚刚开场。
职场"地震"预警:大模型它,真的“不当人”了?
还记得我们还在琢磨MMLU、HellaSwag这些测评基准时,大模型已经像坐了光速列车一样,一路狂飙到多模态的MMMU、MathVista,甚至玩起了Agent任务、Tool-use测试。这些名字听起来就头大?简单来说,就是AI不仅能写诗作曲画画,还能自己规划任务、使用工具,甚至学会了“察言观色”,越来越像那么回事儿了。
但这还不够,METR觉得现有这些“考试”都太小儿科了,根本衡量不了LLM在现实世界复杂任务中的真实水平。于是,他们祭出了一个新“大招”:“50%任务完成时间视野”(50%-task-completion time horizon)。这名字听着有点绕,翻译成人话就是:AI能有50%概率搞定的那些任务,人类通常需要花多久才能搞定?
“AI能以50%成功率完成的任务,人类通常需要花多久?” —— METR的灵魂拷问,直击打工人内心。
是不是有种“被偷窥”的感觉?METR就像一个严谨的“班主任”,不仅出了新考卷,还把人类的平均完成时间作为“标准答案”,再把AI拉出来遛一遛。结果,那真是意料之外,情理之中:人类做起来越慢、越复杂的任务,模型做起来就越容易“翻车”。反过来,模型能搞定的任务,通常也是人类耗时较短的。这说明啥?说明这个**“人类耗时”的丈量尺度,是真·有效!**
能力“光速”进化:谁的青春不迷茫,谁的饭碗不颤抖?
在严谨的统计分析之后,METR团队给大模型的能力演进画了一张**“时间简史”**。他们选取了每个时间段的“最强王者”,然后……结果就惊掉了所有人的下巴:在过去的六年里,大模型的能力确实是每7个月就翻一番!
这跟我们平时感觉到的“AI越来越聪明”完全吻合,但精确到“7个月”这个数字,是不是感觉有点窒息?
想想看:
- 2023年之前的那些老前辈(比如GPT-2和GPT-3),它们只能处理一些“小打小闹”的简单文本任务,比如写几句话。一旦任务复杂点,人类需要超过1分钟来完成的,它们就直接“歇菜”。
- 再看看现在这些“当红炸子鸡”:Claude 3.5 Sonnet、o1模型,它们已经能啃下人类要花数小时才能完成的“硬骨头”,甚至在十几小时的超长程任务上,还能保持不错的成功率!
这简直就是**“前浪死在沙滩上,后浪拍死在前浪的工位上”**的真实写照啊!模型越新,能啃的任务就越难,进步的痕迹简直不要太明显。
效率碾压:2030年,你可能要给AI“打工”了?
好了,最刺激的部分来了!按照这个**“7个月翻一番”的惊人速度,METR团队预测,到2030年,最先进的LLM将有望以50%的可靠性,搞定一个每周工作40小时的人类工程师,需要花整整一个月才能完成的任务**!
更“要命”的是,LLM完成这些任务的速度可能远超人类,也许只需几天,甚至几小时。这就意味着:
- 你还在写报告,AI可能已经写出一部像样的小说。
- 你还在敲代码,AI可能已经帮你把公司创办起来,甚至把你的老板给“优化”了。
- 你还在琢磨怎么改进现有的大模型,AI可能已经自我迭代,变得更加强大。
AI研究员Zach Stein-Perlman直接在博客里来了句**“这影响巨大,无论是潜在好处还是潜在风险”**1。METR的Kinniment也坦承,这速度简直像科幻电影里灾难来临的前奏,让人有点“方”2。
当然,她也给我们留了点“念想”:现实世界中,AI的进展可能会受到硬件、机器人技术等瓶颈的掣肘。毕竟,再聪明的AI,也得有个“身体”去落地执行。就像一个顶级大脑,没有强健的四肢和灵巧的双手,也无法真正“搬砖”。
不过,回看AI的飞速发展,得益于大数据、计算能力和算法的不断优化,全球各国和企业都在疯狂投入,AI生产力效应凸显34。所以,这种“瓶颈”能拖多久,谁也说不准。反正,留给人类“躺平”的时间不多了,是时候考虑学点**“人设”崩塌后AI不能轻易替代的技能了**。毕竟,2030年,听起来也就**“眨眼间”**就到了。
引用
-
Large Language Models Are Getting Smarter at an Exponential Rate · IEEE Spectrum · Evan Ackerman(2025/7/15)·检索日期2025/7/15 ↩︎
-
Large Language Models Are Getting Smarter at an Exponential Rate · IEEE Spectrum · Evan Ackerman(2025/7/15)·检索日期2025/7/15 ↩︎
-
关于人工智能(AI)的发展现状和未来趋势的详细分析!·深圳人工智能产业创新协会(2025/7/15)·检索日期2025/7/15 ↩︎
-
2025年人工智能指数报告 · Stanford HAI(2025/7/15)·检索日期2025/7/15 ↩︎