TL;DR:
MiniMax M2.5 震撼发布,主打“全栈工程能力”与“Vibe Coding”,性能直逼 Claude Opus 4.6。只要 1 美金时薪,就能雇到一个 100TPS 射速、能写前后端、带数据库、还能自动做 PPT 的“完美替身”,这波是真的要把 AI 应用的价格打成“白菜价”了。
春节档的“模型大战”还没歇火,国产大模型圈又杀出一匹黑马。MiniMax 正式官宣了提前“抢跑”的新旗舰模型 M2.5。
如果说以前的模型写代码是“画饼”,那 M2.5 这次是直接把饼烤好、外加配送到家,甚至连装饼的盘子(数据库)都给你洗干净了。1
技术大揭秘:10B参数的小身板,为何能硬刚Opus?
在很多人的印象里,参数量越大越强,但 M2.5 偏要玩“以小博大”。它的激活参数量仅有 10B,却在编程最硬核的 SWE-Bench Verified 榜单上拿到了 80.2% 的高分,在多语言任务上甚至冲到了全球第一。12
这意味着什么?这就好比一台搭载了 V12 引擎的紧凑型轿车,占地小、油耗低,但油门一踩就能让那些体型巨大的“老大哥”们看尾灯。
调侃一下: 别看它体型小,它的思考逻辑像个有强迫症的老架构师。
为了防止 AI 在长链路任务中“跑偏”,M2.5 引入了 Process Reward(过程奖励)机制。1 以前的模型是等结果出来再打分,M2.5 则是边干边盯着,每一步都得“做对”。这种机制让它在处理繁琐任务时表现得极度老练:比如让你抓取富豪榜数据,它会自动建好数据页、来源页和封面页,格式规整得像个入职五年的精英员工。1
体验升级:从“画个皮”到“连皮带骨头”的全栈交付
这次 MiniMax 特别强调了一个词:Vibe Coding。
简单来说,就是你只需要提供“感觉”和“业务逻辑”,剩下的脏活累活全交给 AI。以前的模型顶多帮你写个前端界面(画个皮),而 M2.5 能连带着后端逻辑、数据库设计一锅烩了。13
在一个“豪华猫咪隧道电商网站”的测试中,M2.5 不仅搞定了视差滚动这种高级视觉效果,还塞进了一个能点着玩的 3D 配置器。最离谱的是,这不仅仅是一串代码,而是一个直接能运行的完整项目。1
更让打工人狂喜的是,它能无缝接入 OpenClaw 等智能体框架。4
- 任务: “把桌面这 100 个乱七八糟的财务文件按格式重命名,分析支出,再给我做个深色科技感的 PPT。”
- M2.5 的反馈: “唰”地一下搞定。它甚至能看懂账单里的猫腻,提醒你某家云服务商收钱太贵,建议你去谈个年度合同降本。1
这种能从数据里挖出业务洞察的能力,确实让用户体验到了一种“翻身当老板”的快感。
行业“地震”:1美金时薪,AI应用爆发的前夜?
性能强也就算了,M2.5 最狠的一招是把价格和速度卷到了极致。
- 快: 推理吞吐量飙到了 100TPS,是主流旗舰模型的 2 倍。2 跑代码 Bug 或者大规模数据清洗时,那种瞬间刷屏的爽感,谁用谁知道。
- 省: 1 美金就能让这个“全栈替身”连续工作一小时。1 这个成本甚至低于你每天喝的一杯奶茶,却换来了一个不摸鱼、不抱怨、且拥有顶级架构师思维的生产力引擎。
MiniMax 透露,M2.5 在其内部已经接管了 30% 的真实业务。1 从写代码到做报表,它已经不再是那个只会聊天的 Copilot(副驾驶),而是正在进化成真正的独立引擎。
当 AI 解决了“贵”和“慢”这两个硬骨头,我们离 AI 应用的全民大爆发,可能真的只有一步之遥了。接下来,你只需要负责踩油门(下达目标),至于引擎盖底下怎么转,AI 已经帮你承包了。
引用
-
1美金时薪雇个全栈替身,MiniMax M2.5让打工人也能体验当老板的感觉 · 36氪 · 克雷西 (2026/2/13) · 检索日期2026/2/13 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
MiniMax M2.5 旗舰编程模型上线,对标Claude Opus 4.6 · 新浪财经 · IT之家 (2026/2/13) · 检索日期2026/2/13 ↩︎ ↩︎
-
MiniMax M2.5正式上线,直接对标Claude Opus 4.6 · 东方财富 · 每日经济新闻 (2026/2/13) · 检索日期2026/2/13 ↩︎
-
我给Claude Code 加装了MiniMax M2.5:它像“法拉利” · 知乎专栏 (2026/2/13) · 检索日期2026/2/13 ↩︎