TL;DR:
作为前字节跳动视觉技术负责人,王长虎创立的爱诗科技通过追求极致的算力与工程效率,成为视频生成赛道的领跑者。他坚持不躲避大厂竞争,主张以模型与产品的深度协同,打破专业与大众的创作壁垒。
北京的一间开放办公区里,没有CEO专用的独立办公室。王长虎穿着一件平实的连帽衫,与一百多位同事挤在一起,这种“简单直接”的办公形态,被他定义为“爱诗范儿”。在外界看来,他是“字节系”出身最猛的AI创业者,在6个月内拿到了25亿元融资;但在王长虎内心深处,这种高节奏的冲刺,更像是一场关于“认知”与“效率”的生存博弈。
从字节跳动到独立战场
2023年,当王长虎决定离开字节跳动创立爱诗科技时,AI视频生成领域远未像今天这般拥挤。曾在微软亚洲研究院深耕多年,并主导了抖音和TikTok视觉AI中台搭建的他,深知视频数据的价值与大模型的边界。
在王长虎眼中,创业者的底气不来自于避开巨头,而在于如何“在资源受限的情况下,比大厂跑得更快”。他极其推崇“效率”二字,这源于他在字节时期管理数万块GPU的系统性训练经验。他多次提到一个数学逻辑:最好的团队与最差的团队之间,效率差距往往是“5的5次方”。这种对路径选择的极度审慎,支撑着爱诗科技每3个月便进行一次模型大版本迭代。
视频生成的“破圈”哲学
王长虎并不盲目追求参数规模的堆叠。对于Sora这类先行者的挫败,他展现出了一种客观而温和的审视:他赞赏其音画同步的勇敢尝试,但同时也指出了行业共性问题——如果无法通过产品化手段(如模板)将生成成功率提升至接近100%,那么技术再炫目,也难以触及普通用户。
“让全球几十亿人,从旁观者变成创作者。”这是他的愿景。为了实现这一点,王长虎将重心放在了模型与产品的协同上。他认为,AI视频的未来不是单纯的工具,而是一种新的社交语言。当被问及如果大厂入场是否要选择撤退时,他显得格外的坚定:“创业者不应躲避炮火。我们一直believe的事情,远比简单的存量竞争更广阔。”
在进化中寻找边界
爱诗科技目前正处于“两线作战”的状态:一面是面向大众的PixVerse平台,致力于降低创作门槛;另一面是深入影视与营销垂直领域的行业大模型,如PixVerse C1。王长虎清楚,纯粹的MaaS(模型即服务)模式终将面临内卷,模型必须与行业深度融合,才能真正产生不可替代的壁垒。
面对未来,这位80后的技术领袖始终保持着清醒。他会为“AI视频是否真的能走进千家万户”画个问号,也会为“To B与To C的界限是否彻底消融”反复推敲。这种带着思辨色彩的审慎,或许正是他能从激烈的AI战火中杀出的秘诀——他不迷信规模,只相信那些能够不断进化、提升效率的技术本质。