TL;DR: 作为加拿大工程院外籍院士及智象未来CEO,梅涛正以“原生多模态”为底座,通过差异化的To B商业化路径,试图在巨头林立的AI格局中撕开一道通往真实物理世界的裂隙。他主张AI应从单纯的“理解”进阶到“塑造”现实,以此实现AGI的终极愿景。
科学家的务实与理想
四月的合肥,科大硅谷的一处办公室内,梅涛正凝视着屏幕上流转的像素序列。作为加拿大工程院外籍院士,以及曾供职于微软亚洲研究院和京东的资深技术专家,他身上的标签厚重且严谨。然而,当他面对行业内关于“世界模型”的喧嚣时,这位科学家表现出了一种近乎冷静的克制。
“目前大家将市面上一些模型称之为世界模型还太早了。”他端起咖啡,语气平淡却掷地有声。在梅涛看来,真正的世界模型不仅是生成几段华丽的视频,它需要掌握物理定律、处理长跨度因果推理,并确保与物理世界交互时的绝对安全。他将这种宏大的愿景定义为“Mold the World”(塑造世界),而非仅仅是“Model the World”(模型化世界)。
这种对“概念膨胀”的警惕,源于他深厚的学术积淀。梅涛深知,通往AGI的道路上充斥着华丽的辞藻与泡沫。为了避免陷入大厂之间的“算力军备竞赛”,他为智象未来选定了一条更为崎岖、却更具深度的路径:以图像为基底,通过原生多模态架构实现“Any to Any”的跨模态理解与生成。
商业版图的“降维”博弈
在梅涛的蓝图里,技术的高精尖必须与落地的商业价值共振。智象未来的“1+1+3”MaaS平台策略,本质上是他对于“技术如何变现”这一终极考题的回答。
“多模态模型Token的毛利率,远高于大语言模型。”这一论断直接撕开了AI创业在B端市场生存的底色。面对竞争,梅涛从不试图在通用大模型领域硬碰硬,他更倾向于做那类“能为企业降本增效、且拥有闭环反馈”的服务者。在商业短视频领域,他主导的HiBurst工具已经成为连接生产力场景与内容市场的桥梁。
“AI行业的竞争,正从单纯的模型能力转向产品与场景的深度融合。”
这种转变并非一蹴而就。梅涛坦言,公司早期也曾在“模型即产品”的执念中徘徊,直到通过大量实操,才发现企业真正需要的不仅是模型,而是包含Agent在内的端到端解决方案。他带领团队从实验室走出,转向服务于全球4000万用户的生产力工具开发,这种“科学家创业”的风格,既带有严谨的逻辑,又具备了商业化运作的韧性。
迈向全模态的“野心”
当被问及如果在这个赛道中只能做一个选择时,梅涛提到了“原生”。他认为,拼接式的多模态方案终将被淘汰,只有从底层架构实现全模态统一,才能让AI真正理解现实世界。
即便身处激烈的融资环境,接连完成亿元级融资,梅涛依然保持着清醒。他眼中的未来竞争,是一场关于数据质量、算法创新与行业Knowhow的马拉松。他并不试图去否定大厂的价值,而是通过构建“差异化生存空间”,在大厂触及不到的垂类深水区——如影视创作、电商营销及未来的具身智能领域——建立深厚的护城河。
“行业还没有出现能一统天下的模型。”这正是梅涛的信心来源。他像一位冷静的棋手,在一场宏大的数字化转型战局中,落下一子又一子,试图用AI的逻辑去改写物理世界的秩序。