TL;DR:
随着大模型能力趋同,科技巨头正将AI竞争焦点从云端转移至AI眼镜和AI手机等设备端,通过革新人机交互方式,重构平台生态主导权。这不仅是硬件之争,更是对“AI Agent”意图执行能力的落地探索,预示着一个由端侧AI驱动的新平台周期的开启。
大模型参数的军备竞赛已显疲态,真正的AI竞争已悄然从云端的高楼转向用户手边和眼前更贴近物理世界的终端设备。在一个月内,阿里巴巴连发六款夸克AI眼镜,字节跳动则通过豆包手机助手深度嵌入中兴新机,备货高达50万台工程样机,巨头们纷纷“软硬双打”,其深层意图在于抢夺下一代人机交互的平台入口,而非简单的硬件出货量游戏。12
大模型“见顶”:AI战场从云端转向设备端
2024年上半年,AI大模型的能力竞赛达到一个阶段性高峰。头部玩家如OpenAI、Anthropic推迟下一代模型发布,国内主要模型的能力差距也在快速收敛。用户对模型本身“智力”的感知开始模糊,技术天花板尚未触及,但市场热度已出现滞涨。这标志着,仅凭模型参数或通用智能的提升,已不足以在日益同质化的竞争中脱颖而出。1
焦点因此转移至“模型如何被感知”、“如何被有效利用”。用户并不直接与大模型互动,而是通过终端设备获取服务。端侧硬件,例如AI手机和AI眼镜,成为将模型能力转化为实际价值的核心触点。阿里智能终端产品负责人晋显指出,所有大模型训练数据都依赖于端侧发生的业务数据,端侧不仅是模型的分发终端,更是其“反馈闭环”的关键环节。每一次用户交互、每一步操作路径,都成为模型进化的反向加持。1
更进一步,当AI进入“Agent阶段”,即从“你问我答”进化为“说一句话,把事做了”的意图直达模式时,对端侧的依赖性尤为显著。Agent需要深入操作系统底层,具备多模态的屏幕理解能力,甚至能够跨应用执行复杂任务链。例如,豆包手机助手被期望能理解“帮我在美团给上周的订单写个好评”,并能跨越App、模拟点击路径完成任务。1 这种能力不仅关乎“交互效率”,更触及**“生态主导权”。谁能掌控设备、系统权限和用户入口,谁就能在未来的AI平台格局中占据核心地位。全球范围内,OpenAI斥资近65亿美元收购硬件公司IO,谷歌Gemini团队与三星合作,小米、理想、Meta、苹果等巨头也纷纷布局AI硬件,都反映出这种对“不能失去入口”**的深层焦虑。123
双雄并进,殊途同归:阿里“造新物种”,字节“重构系统”
尽管都瞄准AI硬件赛道,阿里和字节的战略路径却大相径庭,却指向同一个终极目标:争夺下一代平台级入口。
阿里夸克AI眼镜:新入口的激进探索
阿里选择了一条“从零开始”的路径,致力于打造AI眼镜这一“新物种”。其发布的六款夸克AI眼镜,被定位为“功能优先”的工程机风格,不追求时尚,而直奔实用性。阿里智能终端业务负责人宋刚明确表示:“它是未来最有机会挑战手机的设备。”13 这不仅仅是营销话术,更是一次彻底的交互逻辑重构。在手机时代,用户通过“下载App—打开—搜索—操作”完成任务;而AI眼镜的愿景是“一句话完成任务”,如“帮我拍照上传微博”,AI即可调用摄像头、识别场景、发布内容。底层逻辑不再是App,而是Agent——一个能理解意图并主动执行的交互中枢。这背后是阿里云端模型与终端协同的典型思路,通过自研硬件获取足够权限,打通数据采集、系统调用和用户交互的全流程,以“喂养”和迭代大模型。1
字节豆包手机助手:现有入口的深度改造
字节跳动则采取了截然不同的策略:不造手机,而是**“重做手机系统”。与中兴合作发布的nubia M153工程样机,其核心卖点是深度嵌入操作系统、具备完整任务链执行能力的“豆包手机助手”。它通过多模态大模型理解屏幕界面,实现“虚拟屏幕内完成复杂任务”的能力,例如“下个月去巴黎,帮我把收藏的餐厅标在地图上”,豆包能拆解并执行多步跨应用操作。1 这实质上是“重构手机操作系统的主控逻辑”,让AI成为系统的“第一入口”,而非App内的一个功能。字节选择与手机厂商合作,通过软件能力深嵌设备生态,迅速扩大市场触点。据报道,nubia M153首销备货量高达50万台,显示出字节对此战略的激进投入。1 字节在硬件领域的多元布局,从收购锤子团队、PICO到Oladance,再到如今的Ocean部门高优先级战略配置,都体现了其对终端入口控制权**的坚定决心。2
商业格局重塑与平台主导权的争夺
这场AI硬件之争的核心,在于对未来平台主导权的抢夺。传统移动互联网时代,操作系统(iOS/Android)和超级App(微信、支付宝等)掌握着流量入口和数据资源。在AI Agent时代,谁能成为用户与服务之间的“第一媒介”,谁就能定义新的规则、分发新的价值。
这种转型带来了巨大的商业重塑潜力:
- 新商业模式: AI Agent与硬件的结合,可能催生基于“任务完成”或“意图实现”的服务订阅模式,而非传统的广告或App内购。
- 产业生态链条迁移: 软硬件一体化趋势加强,芯片、传感器、光学显示等关键零组件厂商将迎来新增长周期,尤其在端侧AI芯片和Micro-LED技术方面。4 国务院《关于深入实施“人工智能+”行动的意见》也明确提出,到2027年智能终端普及率超70%,直接刺激了产业端的加速布局。4
- 投资风向转变: 资本市场对AI硬件和端侧Agent的关注度持续上升。OpenAI的大手笔收购,以及中兴通讯股价因豆包合作而涨停,都反映了市场对这一方向的积极预期。2
AI硬件的现实挑战与未来路径:泡沫与先声
尽管前景广阔,AI硬件的落地并非坦途,面临诸多现实挑战。
技术成熟度与用户体验
当前,无论是豆包手机助手还是夸克AI眼镜,都更接近**“技术验证型入口”或“工程机风格”**。豆包助手的“任务链执行”和“屏幕识别”的稳定性、多App任务执行中的异常处理、安全容错等问题,都反映出系统级AI控制对操作系统架构的重构所带来的复杂性。夸克AI眼镜在传感器、续航、算力集成等方面也存在显著瓶颈,要真正实现“识别环境 + 意图理解 + 动作执行”,所需的稳定多模态推理和场景建模能力,在2025年仍是高门槛命题。1 官方文档中明确提示“操作手机”功能尚处技术预览阶段,这揭示了AI Agent在现阶段“幻想”与“现实”之间的拉扯。
隐私、安全与伦理挑战
AI Agent的“自动操作”能力,特别是绕过用户主动点击实现任务闭环,引发了深层次的数据权限、个人隐私和支付安全担忧。尽管支付环节保留人工确认,但AI Agent直接模拟交互操作的能力,仍可能带来滥用风险。在安全边界和系统权限标准尚未建立的初期,这类“能力超纲”的AI产品可能会成为监管灰区。这需要行业、监管机构共同努力,构建透明、可控、负责任的AI治理框架,以赢得用户的信任。
市场普及与用户心智
AI眼镜在国内市场仍处于早期阶段,天猫“双11”期间智能眼镜成交额虽激增2500%,但整体出货量距离“普及”仍有显著差距。35 用户是否真的准备好将“交互权”乃至部分“决策权”交给AI,仍是一个需要时间验证的问题。这种从主动操作到意图直达的交互范式转变,需要用户心智的逐步适应和教育。
然而,这些挑战不应被视为泡沫的迹象,反而表明我们正处于AI平台进化的必然阶段。当Chatbot不再新鲜、App用户增长放缓、模型能力难以被有效感知时,只有通过重构交互形态,AI才能重新塑造其“用户价值感知界面”。硬件并非终点,而是一次“打通入口-调用系统-采集数据-反馈模型”的平台级重构,是迈向真正环境智能(Ambient Intelligence)的关键一步。
对人类文明进程的深远影响
这场围绕AI终端的竞争,其影响远超商业范畴,正触及人类文明进程的深层变革。
- 人机交互范式的根本性转变:从屏幕触摸、语音指令等“主动交互”向“感知即交互”、“意图即执行”的**环境智能(Ambient Intelligence)**演进。AI将不再是工具,而是融入环境、深度理解并预判用户需求、主动提供服务的“智能伴侣”。
- 数字生活与物理世界的融合:AI眼镜作为“第一视角头部设备”,能捕捉80%以上的人体感官输入3,这将极大地模糊数字信息与物理现实的边界,催生全新的增强现实(AR)体验和生活模式。
- 认知负荷的转移与“人类中心”的再思考:AI Agent旨在接管大量日常任务,将极大减轻人类的认知负荷。然而,这也引发了对人类决策权、独立思考能力以及“何谓人类独特价值”的哲学思辨。我们需要重新审视人与智能系统之间的界限和协作模式。
- 平台经济的下一站:AI终端将成为新型平台经济的载体,重塑数据流、服务流和价值流。围绕这些新入口,将涌现出更多以Agent为核心的应用和服务,彻底改变我们习以为常的App生态系统。 这场竞争,不仅关乎科技巨头的未来版图,更是在定义我们未来生活、工作和思考的方式。
引用
-
AI眼镜与AI手机,巨头们的软硬双打·高见观潮·高恒 (2025/12/2)·检索日期2025/12/2 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
阿里字节先后入局,这个赛道要变天了? - 虎嗅·凤凰网科技·凤凰网科技 (2025/11/27)·检索日期2025/12/2 ↩︎ ↩︎ ↩︎ ↩︎
-
巨头鏖战AI眼镜赛道 - 证券时报·证券时报·梁傲男 (2025/11/28)·检索日期2025/12/2 ↩︎ ↩︎ ↩︎ ↩︎
-
重点主题 - 投资只关乎未来·Themepica (2025/8/?)·检索日期2025/12/2 ↩︎ ↩︎
-
夸克AI眼镜发布:首款搭载千问的硬件,阿里称将向更多智能终端延展·澎湃新闻·吴雨欣 (2025/11/27)·检索日期2025/12/2 ↩︎