TL;DR:
视频AI圈出了个“扫地僧”,代号「HappyHorse」的模型空降榜首,把刚刚登顶的Seedance 2.0按在地上摩擦。结果扒开马甲一看,这竟然是个“开源仔”的魔改版,闭源大厂靠效果拉开的护城河,这次可能真的要漏风了。
就在所有人还沉浸在OpenAI停掉Sora、Seedance 2.0准备“一统江湖”的剧本里时,AI界最著名的“公职评测机构”Artificial Analysis最近出了个大新闻:一个代号为**「HappyHorse-1.0」(欢乐马)**的神秘模型空降视频生成榜首。1
这可不是那种靠公关稿堆出来的“自封第一”,而是全球用户蒙眼盲测投出来的真金白银。这匹马不仅跑赢了,还跑出了**“断层感”**:在纯视频生成类别中,它的Elo积分高达1347分,领先第二名Seedance 2.0整整74分。要知道,目前榜单上第2名到第19名的分差加起来也就70分左右。1
这种感觉就像你刚买了台最新款跑车准备炫耀,结果隔壁邻居骑着一匹“马”在高速上把你超了,还给你留下了一个潇洒的背影。
扒马甲:学术“扫地僧”与他们的150亿参数大招
“欢乐马”到底是谁家的?社交媒体上的技术大佬们立刻开启了“赛博探案”模式。
网友们发现,HappyHorse官网(happyhorseai.net)的语言排序里,普通话和粤语居然排在英语前面。2 再联想到2026年正好是农历马年,这股来自东方的“马力”指向性已经很明显了。经过多方比对,这匹马的真身终于浮出水面:它极大概率是开源模型**daVinci-MagiHuman(达芬奇魔法人类)**的优化迭代版。2
这背后的团队堪称“学术圈扫地僧”组合:一支是来自上海创智学院(GAIR)的刘鹏飞团队,另一支则是北京的创业公司Sand.ai(三呆科技),创始人曹越同样学术背景深厚。2
调侃式点评: 果然,AI圈的规律就是——名字起得越花哨(魔法人类),背景往往越硬核;而代号起得越随意(欢乐马),战斗力往往越离谱。
技术层面上,这匹马确实有两把刷子。它采用的是150亿参数的纯自注意力单流 Transformer 架构。2 简单来说,它把文本、视频和音频的token全都塞进一个序列里联合建模,这在开源界还是头一遭。那种以往需要后期配音的尴尬,在这儿被“音视频联合预训练”给解决了。
视频界的“偏科生”:是弯道超车还是垂直绝杀?
不过,这匹马之所以能“断层碾压”,其实也藏了一些聪明的小心思。
目前的AI视频评测中,人像口播类内容占比超过60%。而daVinci-MagiHuman从娘胎里出来就**“极度偏科”人像演绎**。2 在特写镜头、表情一致性上,它确实能把很多通用大模型打得满地找牙。但在处理多人互动、复杂物理规律(比如那个在马桶里弹跳的橡皮筋球)时,它的表现依然会有“翻车”风险。1
而且,这匹马虽然跑得快,但“草料”也贵。据实测,想要顺畅跑起daVinci-MagiHuman,你至少得有一张英伟达H100显卡。2 对于普通宅家开发者来说,本地部署的门槛还是稍微高了点。
行业“地震”:谁在笑,谁在出冷汗?
这次“欢乐马”屠榜,最深刻的意义不在于谁是第一,而在于开源与闭源的平衡点被打破了。
长期以来,像Sora、Seedance、可灵(Kling)这些闭源模型一直靠着“效果断层”来维持定价权。用户心甘情愿掏钱买API,是因为开源模型做出来的视频“没法用”。但现在,一个基于开源底座的“欢乐马”在真实感官上追平甚至超越了头部闭源产品。2
- 对于开发者: 只要开源基座达到了“可交付”门槛,自主部署的成本将大幅下降,隐私合规也更有保障。
- 对于闭源大厂: 护城河正在缩短。如果不能在长视频叙事、多镜头控制等硬骨头场景上再次拉开差距,光靠人像生成可能很难守住江山。
视频AI赛道的“卷”,现在才真正进入白热化阶段。至于“欢乐马”能不能一直快乐下去,就看接下来这几天,官方会不会大方“认领”并放出更强的API了。