曾熙:那个删除对话框的人,要让AI在直觉中重塑世界

温故智新AIGC实验室

TL;DR:

曾熙,这位拥有字节跳动、OPPO、一加三重背景的产品人,正通过Chance AI挑战主流的“对话式”交互。他主张回归人类进化的本能,以“视觉优先”重构AI Agent,试图将AI从冷冰冰的问答工具转变为能够理解现实世界深层意义的“视觉伴侣”。

在当下AI世界的权力版图里,几乎所有巨头都在围绕那个细长的“输入框”排兵布阵。人们被训练着去学习Prompt工程,像翻译官一样将脑海中的直觉转化为精准的语言。然而,曾熙对此提出了一个近乎挑衅的问题:“为什么眼睛不长在屁股上?”

这位巴塞罗那大学的博士,曾在一加、OPPO负责产品设计,后在字节跳动Flow部门深度参与“豆包”等AI产品的早期探索。在他看来,人类大脑约70%的信息处理都与视觉相关。在语言诞生前的漫长岁月中,生存依赖的是对草丛晃动的直觉判断,而非深思熟虑的提问。1

2025年1月,曾熙选择从字节跳动离开。同年3月,他注册了Chance AI。他的目标异常果敢:在产品的首屏删掉那个象征着“效率”与“目的性”的输入框。

偶然性的美学:从《蒙娜丽莎》到“视觉伴侣”

曾熙对视觉的执着,根植于他的学术底色。在巴塞罗那研究认知科学与当代艺术时,他曾站在《蒙娜丽莎》面前感到迷茫——画幅比想象中小,色彩因岁月而暗淡。直到后来他理解了画作背后的达芬奇及其跨时代的透视技法,那层“意义”才真正触动了他。

“人类是视觉动物,也是故事动物。”曾熙如此定义。他给公司取名“Chance”,意为“偶然性”(Contingency)。他认为,生物进化与文明进步往往诞生于偶然的碰撞,而Chance AI的任务,就是加速这种碰撞。1

这种理念外化为一种被称为“Visual Agent”的产品形态。当同行的AI还在纠结于如何写出一篇完美的文案时,Chance AI的用户正举着手机在纽约的艺术展上对着作品扫描,或者在伦敦的街头通过摄像头识别一张限量版球鞋的真实价值。2

这种交互被曾熙形容为“拍照即交互”。用户不需要知道该问什么,只需要“看见”。AI不再是那个被动等待指令的仆人,而是一个参与你“看世界”过程的伴侣。

逃离主流叙事:绕过大厂的辐射区

作为深谙互联网大厂运作规律的“老兵”,曾熙非常清楚,要在OpenAI和Google的夹缝中生存,必须找到那片巨头看不上的、琐碎且带有主观风险的领域。

“我们要离用户离得足够近。”曾熙提到,他的护城河不是模型规模,而是响应速度。当纽约大学的一个潮流社团提出想要识别特定卡牌的需求时,曾熙的团队在6小时内就上线了相应功能。3 这种对Z世代情绪的捕捉,是大厂臃肿的决策链条无法企及的。

目前,Chance AI的核心用户群主要集中在25岁以下的北美年轻人。他们用AI给出的“毒舌”点评自己的OOTD(每日穿搭),用它在圣诞节挑选礼物,甚至用它来检测皮肤状态。3

在曾熙看来,大厂的模型追求的是“安全、标准化、无争议”,这导致它们在解释世界时往往显得干巴巴。而Chance AI敢于介入“意义推理”。一个石块在Google Lens眼里可能只是“花岗岩”,但在Chance AI的解读中,它可能是洛杉矶LACMA博物馆前那块耗资千万美金运来的、象征阶层结构的公共艺术品。1

软硬一体:一个关于“摄像头”的终极野心

尽管目前Chance AI以App形式存在,但曾熙的底色依然是个“硬件人”。他并不掩饰对未来AI硬件的野心。

“未来适合我们产品的硬件形态,应该是一颗包揽人们所有视觉信息的摄像头。”他坚信,未来的交互将不再有模态的区分,就像你看电影时不会分辨是音效还是台词让你流泪。3

但他表现出了创业者罕见的克制。他拒绝盲目追随当下的AI硬件热潮,认为在供应链尚未成熟时,“为了做硬件而做硬件”是极其危险的。他目前更倾向于将Visual Agent的能力授权给硬件厂商,先养成用户“看到什么都拍一拍”的习惯。

这种克制背后是对成本和效率的极度敏感。曾熙透露,由于团队工程能力出色,Chance AI的运营成本控制得极低,这让他有底气在没有任何收费功能的情况下,依然保持着对社区氛围的悉心呵护。3

结语:在直觉中重塑逻辑

曾熙的路径更像是一场关于人类本能的复权运动。他试图证明,AI的未来并不只存在于逻辑缜密的文字堆砌中,更存在于那转瞬即逝的好奇心和视觉直觉里。

当他谈到2026年的目标时,他没有提到那些宏大的商业指标,而是强调要继续深入北美的学生社群。他似乎享受这种作为“少数派”的姿态——在一个所有人都在加强“语言交互”的时代,他正带着他的“视觉大脑”,悄悄地教AI学会如何像人类一样,带着情感和故事去凝视这个世界。

这种凝视,或许正是科技在冷峻的算力之外,最富有温度的一面。

引用