TL;DR:
Anthropic又来“偷袭”打工人了!新发布的Claude Opus 4.6不仅能带1M上下文玩“大海捞针”,还能派16个分身并行搞工程;华尔街分析师和安全白帽集体汗流浃背,毕竟这货不仅能两周写完编译器,还能顺手自修500个零日漏洞。
一睁眼,Anthropic家的“卷王”Claude Opus 4.6就来给大家拜年了——虽然这拜年的姿势有点生猛,直接把华尔街给吓跪了。
消息一出,金融数据界的老大哥FactSet盘中暴跌10%,标普全球、穆迪、纳斯达克纷纷跟跌1。投资者的逻辑简单粗暴:如果AI几分钟就能把复杂的财务报表分析得明明白白,那这些卖金融数据的公司还有啥饭碗?这已经是Anthropic本周第二次“血洗”市场,前几天刚上线的法律插件刚引爆了软件股,今天Opus 4.6就亲自下场接管财务、编译器和安全审计了2。
1M上下文+自适应思考:鱼的记忆变“完美复读机”?
以前大家用大模型,最怕它“聊着聊着就忘了”。这次Opus 4.6直接把上下文窗口拉到了100万Token3。
在被称为“大海捞针”的MRCR v2测试中,它拿到了76%的高分,而前代Sonnet 4.5只有可怜的18.5%3。这意味着它终于告别了“上下文衰减”的尴尬,能在几十万字的文档里精准定位那个藏在角落里的Bug或条款。
更“骚”的操作是自适应思考(Adaptive Thinking)。以往开发者要在“深度思考”和“快速回答”之间二选一,现在Claude会根据问题难度自己掂量:简单的问候秒回,复杂的逻辑自动开启“CPU烧烤模式”2。甚至还配了low到max四档调节,像极了你那会根据加班费多少来决定工作状态的同事。
“分身术”显灵:16个Agent组团写代码,还能跑Doom!
这次发布最让人虎躯一震的,莫过于**Agent Teams(智能体团队)**功能4。
Anthropic的安全研究员Nicholas Carlini做了个极其疯狂的实验:派16个Claude实例并行协作,目标是从零开始用Rust写一个能编译Linux内核的C编译器3。
- 战绩: 两周时间,2000次会话,10万行代码。
- 成果: 产出的编译器不仅能编译Linux 6.9,甚至还能跑通那款著名的“能在万物上运行”的游戏《毁灭战士》(Doom)2。
- 成本: 只要不到2万美元。相比之下,请个这种水平的专家团队,两周可能连需求文档都没对齐3。
这套机制最精妙的地方在于它用了“锁机制”防止撞车——每个Agent写文件前先“领任务”,自动处理冲突。没有复杂的编排,全靠AI自觉3。这让不少程序员陷入沉思:以后我是不是只需要当个“监工”,天天看Claude自己卷自己?
“重构后的代码美得惊人,虽然暂时跑不起来,但那逻辑干净得像艺术品。” —— 某深陷重构泥潭的CEO“vas”感叹道1。
安全圈地震:500个漏洞开箱即挖,白帽要失业?
如果你觉得写代码只是“基操”,那Opus 4.6在网络安全领域的表现简直是“核弹级”的。
Anthropic把这货扔进沙箱,啥也不教,就让它去翻开源代码。结果它反手就挖出了500多个此前从未公开的零日漏洞(0-day),包括缓冲区溢出、内存损坏等高危问题4。在处理GhostScript项目时,它甚至通过翻看Git提交历史,找到了连传统扫描工具都漏掉的深层漏洞,并顺手写好了PoC(概念验证代码)来证明:“看,这儿真能黑!”4。
为了不让这玩意儿变成黑客的“神兵利器”,Anthropic赶紧加了六套探测机制,主打一个“我可以,但你不能乱来”3。
办公三件套:PPT直出,AI味儿淡了
在“入侵”传统领地方面,Claude这次对Excel和PowerPoint下了狠手。
现在的Claude Excel集成版能直接摄入凌乱的非结构化数据,自己推断表格结构5。更绝的是PPT集成预览版,它能记住你公司的模板、字体和布局风格2。以后老板让你熬夜赶方案,你只需要喝着咖啡看Claude表演,生成的PPT完全没有“AI僵尸感”,简直是糊弄学大师的福音。
当然,老对手OpenAI也没闲着。在Opus 4.6发布的几分钟后,OpenAI就搬出了GPT-5.3-Codex贴身肉搏14。目前来看,Codex在纯编程基准测试上依然微弱领先,但Opus 4.6在金融、法律等“高价值知识工作”领域的表现,以144 Elo分的优势把对手甩在了身后2。
引用
-
Claude Opus 4.6杀死编程比赛!挖出500个day0漏洞,生成k线成交 ... · 新浪科技 · 智东西 (2026/2/6) · 检索日期2026/2/6 ↩︎ ↩︎ ↩︎
-
Claude Opus 4.6杀死编程比赛!挖出500个day0漏洞 - 智东西 · 智东西 · 智东西报道 (2026/2/6) · 检索日期2026/2/6 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Claude Opus 4.6 登场:死磕编程与办公场景,AI 自动化财务分析 / 图表制作 · 17173 (2026/2/6) · 检索日期2026/2/6 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
分水岭,Claude4.6做出Agent集群,GPT-5.3开始"自我繁殖" · 虎嗅网 · 硅星GenAI (2026/2/6) · 检索日期2026/2/6 ↩︎ ↩︎ ↩︎ ↩︎
-
OpenAI、Anthropic发新模型,一个替你写代码,一个替公司管流程 · 新浪科技 (2026/2/6) · 检索日期2026/2/6 ↩︎