TL;DR:
那个在OpenRouter霸榜多日的匿名大佬“Hunter Alpha”身份揭晓,居然是小米的MiMo-V2-Pro!雷军豪掷160亿,罗福莉深夜放话:这波“安静的突袭”直接把AI圈卷麻了,压力现在来到了DeepSeek这一边。
神秘“猎人”脱马甲,小米这波玩得有点野
前阵子,全球开发者都在满世界找一个叫“Hunter Alpha”的神秘模型。它在API聚合平台OpenRouter上一上线就开启了“收割模式”,连续多天霸占调用量日榜第一,累计调用的token数直接突破了1T1。大家都在猜,这到底是哪家大厂又在偷偷藏大招?是硅谷新贵,还是那个总是能搞出惊喜的“深海鱼”?
谜底终于在今天揭晓了。雷军带着小米MiMo-V2家族模型正式亮相,顺便一脸淡定地“认领”了这两件马甲:此前的Hunter Alpha正是MiMo-V2-Pro的早期内测版,而另一个Healer Alpha则是MiMo-V2-Omni1。
这种“先在野外打成满级,再回来办满月酒”的行为,被小米技术大拿罗福莉形容为一场“安静的突袭”2。更狠的是,雷总直接在发布会上放话:MiMo-V2-Pro的榜单表现已经超过了马斯克的xAI Grok。今年小米要在AI研发上砸下超过160亿软妹币,主打一个“不差钱”且“进展比大家想得快”34。
1T参数配上“混合注意力”:除了能干活,它还没套路
这次发布的MiMo-V2-Pro,定位非常清晰:为Agent(智能体)而生的旗舰模型。
别看现在大模型满街走,但能真正搞定复杂长链路任务的其实没几个。MiMo-V2-Pro总参数量超过1T(万亿级),激活参数42B。它采用了一种叫**Hybrid Attention(混合注意力)**的架构1。简单理解,这就像是给AI的大脑装了一套“自适应变速箱”,在处理1M超长上下文时,既能保持敏锐的洞察力,又不会让推理效率崩盘。
罗福莉在推特(X)上透露了一个细节:为了让团队真正理解什么是Agent范式,她直接下了死命令——“谁到明天为止还没完成100次对话,谁就可以走人”1。这种硬核的“人肉测试”效果显著,MiMo-V2-Pro在长文能力和Agent场景稳定性上获得了史诗级强化。
在实际体感上,它在OpenClaw、Claude Code等智能体框架中表现出的“执行力”,已经逼近甚至在部分场景超越了Claude 4.6系列,但API定价却只有后者的1/51。小米这次不仅想当“隐形冠军”,还想把前沿智能的门槛直接踹飞。
“全能战士”Omni与“戏精”TTS,小米的底牌全翻了
除了Pro版,另外两位家族成员也各有千秋:
- MiMo-V2-Omni(原名Healer Alpha): 这是一个原生全模态基座。它不只是能“看图说话”,而是通过统一架构把感知和行动深度绑定1。说白了,它能听懂环境音、分清谁在说话、看懂复杂的音视频,还能顺手帮你把GUI(图形界面)操作了。官方实测其音频理解力甚至超过了Google的Gemini 3 Pro1。
- MiMo-V2-TTS: 这是一个专门负责“声音表现力”的模型。小米用了上亿小时的语音数据进行预训练,让它不再是那种冷冰冰的播音腔。它不仅能克隆音色,还能精准控制情绪的起伏,简直是AI界的“实力派演员”1。
结语:压力给到了DeepSeek?
小米这次的突然发力,让原本就热闹的国产模型赛道变得更加诡谲。在此之前,很多人猜测那个神秘的匿名模型是DeepSeek的V4版本,结果谜底揭晓,小米成了那个“截胡”的黑马1。
目前,MiMo-V2-Pro已经正式开放API,并联合OpenClaw等五大框架提供限时免费支持。而隔壁的DeepSeek-V4据传也将在4月上线,主打长期记忆(LTM)的突破1。
当小米开始用“万亿参数”和“160亿投资”说话,当“雷式效率”撞上AI Agent范式,今年的大模型混战,恐怕才刚刚进入最高潮。
引用
-
神秘爆款模型被小米认领!雷军直言超过马斯克 xAI Grok,罗福莉透露MiMo-V2-Pro将开源 · InfoQ · (2026/3/19) · 检索日期2026/3/19 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
小米凌晨模型三连发:罗福莉称为智能体时代打造 · 新浪财经 · (2026/3/19) · 检索日期2026/3/19 ↩︎
-
神秘霸榜模型现真身:小米MiMo-V2 Pro,国内首个万亿参数+ ... · 新浪财经 · (2026/3/19) · 检索日期2026/3/19 ↩︎
-
「AI龙虾」爆红:当AI开始控制你的电脑|梁伟聪 · 星岛加拿大 · 梁伟聪 · (2026/3/11) · 检索日期2026/3/19 ↩︎