端侧AI

Newspaper

12-10日报|AI撕裂云端：智能体具身化，重构万物边界，数字主权与代码未来皆在其手

今天是2025年12月10日。一场深刻的“具身化”革命正撕裂AI的云端堡垒，将推理能力、决策逻辑乃至主权意志，下沉至物理世界的每一个角落、每一行代码、每一个国家主权数字单元。AI不再是高悬空中的算法幽灵，它正以最硬核、最隐蔽的方式，渗透、重塑并最终控制我们所认知的“现实”。

洞察 Insights

超越云端：端侧AI如何重塑智能的物理边界与商业未来

面对云端大模型的高延迟、高成本与隐私挑战，科技界正经历一场向“端侧AI”的价值回归，旨在将万亿参数“暴力瘦身”植入微小芯片。通过知识蒸馏、极致量化等算法创新及存算一体、dNPU等硬件架构变革，构建一个去中心化、实时、私密的“云-边-端”协同智能新范式，预示着一个由嵌入式智能驱动的万物互联时代。

洞察 Insights

豆包“附体”努比亚，字节跳动AI的“灵魂”保卫战，手机圈要“变天”？

字节跳动旗下AI助手“豆包”通过与努比亚合作，推出了一款搭载豆包手机助手的工程样机M153，售价3499元，并迅速售罄。这款AI手机不仅集成骁龙8至尊版芯片，更实现跨应用自动操作、屏幕记忆等“类Siri”增强版功能，旨在以软件体验为核心，撬动硬件市场。这被视为字节跳动“不造手机却想定义手机灵魂”的战略，引发了手机行业关于AI入口和软硬结合新模式的“灵魂拷问”，预示着一场行业变革的到来。

洞察 Insights

AI眼镜卷疯了！巨头"贴脸开大"，手机真的要"退休"了吗？

科技巨头们正掀起一场AI眼镜的“下半场大战”，阿里、理想、谷歌/XREAL纷纷推出新品，意图通过轻便、第一视角记录和深度语音交互等优势，开启AI时代的人机交互革命。分析师预测，AI眼镜市场潜力巨大，未来有望替代传统眼镜，并以AI+AR的形态发展，计算芯片、光学模组和屏幕显示将是关键竞争点。

洞察 Insights

“去魅”与“百镜之争”：AI眼镜如何重塑感知与商业边界

AI眼镜市场在端侧大模型、供应链成熟和手机市场饱和的多重驱动下再次崛起，吸引了互联网巨头、硬件厂商和XR原生企业展开激烈竞争。这场“百镜之争”的关键在于技术“去魅”、挖掘高价值场景并提供自然无感交互，尽管面临高退货率和交互范式割裂等挑战，AI眼镜仍有望成为下一代计算入口，深刻影响人机交互和未来社会形态。

洞察 Insights

效率之刃：MiniCPM-V 4.5如何重塑多模态大模型的商业版图与普惠未来

MiniCPM-V 4.5模型通过创新的3D-Resampler架构、统一数据策略和混合强化学习，显著突破了多模态大模型的效率瓶颈，以更小模型实现超越GPT-4o和Qwen2.5-VL 72B的卓越性能。这预示着AI向端侧设备和企业级应用的加速普及，将重塑AI商业版图，并推动人工智能走向更普惠、更广泛的智能未来。

洞察 Insights

iPhone 17 卖爆了！苹果AI：我，真的那么不重要吗？！

iPhone 17系列在中国销量爆棚，但分析发现，这波热卖与苹果自家的AI服务Apple Intelligence关系不大。尽管苹果CEO库克正努力推动Apple Intelligence入华，但目前用户对现有AI功能感知度不高，更期待“脱胎换骨”的Siri。文章深度剖析了AI迟迟未能成为手机“杀手级”卖点的原因，包括大模型能力局限、差异化不足、端侧AI硬件瓶颈及用户尝鲜热情减退，并展望了AI在手机及其他终端（如汽车）的未来发展。

洞察 Insights

OPPO AndesVL：开源多模态大模型如何重塑端侧AI，驱动下一代AI手机的“即时智能”革命

OPPO推出的AndesVL开源多模态大模型，以其0.6B-4B的灵活尺寸、极致的端侧优化（如稀疏化、QALFT、OKV）和在多项基准测试中SOTA的表现，重新定义了AI手机的性能与隐私界限。这一战略性开源不仅强化了OPPO的市场竞争力，更通过软硬件协同和开放生态，加速了行业向高性能、高隐私、低延迟的“即时智能”体验迈进，预示着手机AI将从云端走向真正以用户为中心的个人化新时代。

洞察 Insights

Jamba Reasoning 3B：端侧智能的里程碑，重塑AI agent与边缘计算的未来

AI21 Labs开源的Jamba Reasoning 3B模型，凭借其革命性的SSM-Transformer混合架构，在3B参数量下实现超长上下文处理和卓越设备端性能，为AI Agent走向去中心化、高安全、低成本的边缘计算提供了关键技术支撑。这一突破不仅有望显著降低企业AI部署成本，更能赋能更智能、私密和个性化的AI Agent应用，预示着AI计算范式的深刻转变。

洞察 Insights

芯片静默，策略轰鸣：苹果A19 Pro与iPhone Air的深层AI布局与垂直整合新范式

苹果A19 Pro芯片凭借GPU神经网络加速器对混合AI工作流的深度优化，以及VC均热板主动散热，展现了其在端侧AI和高性能计算领域的战略性投入。同时，iPhone Air作为自研C1X基带与轻薄设计的试验品，标志着苹果正通过垂直整合实现核心技术自主化，旨在构建极致协同的未来硬件与AI生态。这些举措不仅重塑了iPhone的产品定位，更预示了未来智能终端的竞争核心将围绕全栈自控与深度集成展开。

洞察 Insights

AI助手的隐形之手：无障碍权限下的效率、隐私与未来治理之思

2025年AI Agent迎来爆发式增长，手机智能体利用“无障碍权限”实现跨应用操作，带来巨大便利的同时，也引发了严重的隐私和安全风险，可能导致敏感信息泄露和诈骗。在技术、商业和伦理的交汇点，行业亟需在效率提升与用户数据保护之间找到平衡，通过技术规范、企业自律和监管创新，共同构建一个安全可控的智能体生态。

洞察 Insights

Arm Lumex CSS：边缘智能的范式转移与万亿级TOPS的未来图景

Arm新发布的Lumex CSS平台及其核心SME2技术，通过将百亿级TOPS的AI算力推向边缘，正加速智能终端向自主、实时、高效的AI处理中心演进。这一技术突破不仅显著提升了端侧AI性能和用户体验，更将重塑AI产业的商业格局和生态协作模式，为“智能体（Agent AI）”的广泛普及奠定硬件基础，预示着人机交互与社会形态的深刻变革。

洞察 Insights

苹果的AI“蛰伏”：战略保守抑或下一代智能生态的深谋远虑？

苹果在iPhone 17发布会上对AI的低调处理，是其在经历初期宣传失利后，转向务实、注重硬件集成和用户体验的战略性转变。面对高昂的AI投入、人才竞争和激进的中国竞争者，苹果选择以其独特的生态系统和强大的芯片技术为基石，通过渐进式创新，布局一个更深层、更无感的AI智能生态，而非追求短期的AI热潮。

洞察 Insights

当手机AI“入侵”朋友圈：数字围墙花园的攻防与新秩序的黎明

在AI浪潮下，OPPO等手机制造商正通过系统级端侧AI服务，如“AI帮写”，积极介入用户在超级应用中的内容创作环节，试图打破传统App的流量壁垒并争夺用户核心互动入口。这场无声的较量不仅预示着手机行业将迎来以AI为驱动的第二增长曲线，通过提供增值服务和提升用户忠诚度实现价值重塑，同时也对现有的监管框架和数据安全伦理提出了严峻挑战。

洞察 Insights

苹果“端侧双星”闪耀：揭秘FastVLM与MobileCLIP2如何重塑AI未来边界

苹果通过开放FastVLM与MobileCLIP2两大端侧多模态模型，在移动设备上实现了AI性能的飞跃，将实时交互延迟显著降低并大幅优化模型体积，这不仅保障了用户隐私和极致体验，更标志着苹果正以设备为核心，重塑AI产业的商业版图，引领智能走向去中心化、更具人文关怀的未来。

洞察 Insights

AI硬件的幻象与现实：当AI从“功能”蜕变为“系统属性”

当前AI硬件初创公司如Humane Ai Pin、Rabbit R1和AI Key试图通过专用设备提供AI体验，但其面临技术缺陷、商业模式脆弱及现有智能平台AI能力迅速内化的挑战。本文深入分析了AI从独立“功能”向系统级“属性”的范式转变，强调智能手机等主流设备已成为AI落地的最佳载体，并预测未来AI将无缝融入环境，而非依赖外接配件，最终促成“环境智能”时代的到来。

洞察 Insights

微缩智能：谷歌EmbeddingGemma如何重塑边缘AI的隐私、性能与普适未来

谷歌开源的EmbeddingGemma模型，以仅3.08亿参数实现卓越的端侧AI性能，支持离线运行且内存占用低于200MB，为手机等个人设备带来高性能检索增强生成（RAG）和语义搜索。这一突破性进展不仅有望降低AI应用成本、拓宽场景边界，更将加速普适、隐私优先的边缘智能时代到来，重塑产业格局与人机交互的未来图景。

洞察 Insights

苹果FastVLM：当AI在边缘睁眼——通向普适智能与具身认知的核心跃迁

苹果开源FastVLM模型，以7B参数、85倍加速和端侧离线运行能力，标志着高效视频识别AI向个人设备普及的关键一步。该模型通过创新视觉编码器赋能AR/MR、机器人等具身智能场景，并强调数据隐私，引领AI从云端走向边缘，重塑人机交互与产业格局。这一战略部署预示着未来普适性、个性化AI服务的加速到来，同时也引发了对技术伦理和社会影响的深度思考。

洞察 Insights

Google Pixel 10 AI功能深度评测：实用创新与局限并存

Google Pixel 10在AI功能上实现了多项实用创新，如主动式信息提示_Magic Cue_和指令修图，显著提升了部分日常体验。然而，其AI功能仍存在稳定性不足、误解用户意图、或实用性欠佳的局限，距离真正改变手机交互方式的“AI手机”仍有距离。整体而言，它是一款“搭载了不错AI功能的好手机”，为未来AI手机的发展提供了宝贵经验。

洞察 Insights

小尺寸，大智能：Gemma 3 270M如何重塑端侧AI的未来版图

谷歌开源的Gemma 3 270M模型以其紧凑体量和卓越性能，突破了轻量级AI的边界，在能效和指令遵循上超越同级竞品。这不仅预示着AI向端侧部署和专业化发展的加速趋势，更将显著降低AI应用成本、增强用户隐私，并推动AI技术真正走向普惠和无处不在，重塑未来的商业和生活图景。

洞察 Insights

手机AI要“开眼”了！Liquid AI LFM2-VL：是“卷王”还是“画饼”？

Liquid AI带着新模型LFM2-VL高调杀入手机AI战场，号称能让智能手机拥有“会看”的超能力，而且还又快又轻量化。虽然宣称开源，但许可证的完整文本还没露面，这让外界在期待之余，也多了一丝“等等看”的八卦心态。

洞察 Insights

OpenAI开源模型再掀波澜：从云端到端侧，AI战场的深度重构与哲学博弈

OpenAI时隔六年重磅开源gpt-oss系列模型，以其媲美o4-mini的卓越性能和能够在手机、笔记本上高效运行的能力，加速AI向端侧普及的进程，有望大幅降低推理成本并重塑个人计算范式。然而，其“非完全开源”的策略及在基准测试上的谨慎态度，也引发了关于AI开放边界与商业竞争的深层探讨，预示着未来AI生态将更趋混合与复杂。

洞察 Insights

腾讯混元“小钢炮”炸场：4款模型直通手机，AI打工人这下真来了？

腾讯混元团队近日“放大招”，一口气开源了四款超亲民的小尺寸大模型，参数从0.5B到7B，主打一个“消费级显卡也能轻松跑”，让AI能力触手可及。这些“小钢炮”不仅在Agent智能体和超长文本处理上表现亮眼，还能轻松部署到手机、笔记本等设备，简直是AI“打工人”的福音，预示着AI普惠时代的加速到来！

洞察 Insights

WAIC 2025：智能座舱也开始「读心」了？斑马智行这波操作直接“封神”！

WAIC 2025上，斑马智行携手通义与高通，发布了全球首个基于高通8397的端侧多模态大模型解决方案，让汽车智能座舱从“听话机器”升级为能主动“读心”、断网也能用的“AI管家”，彻底引爆了行业对“人机共生”的想象。

洞察 Insights

AIPC之困：Windows AI功能碎片化与微软硬件策略的深层博弈

微软在Windows 11中集成大量AI功能，试图推动“AI PC”普及，但其对NPU算力（尤其40 TOPs+）的严苛限制及平台碎片化，导致实际用户体验割裂。这暴露了当前“AI PC”在硬件生态整合和商业化落地上的深层矛盾，也预示着AI计算将经历从特定硬件依赖到异构融合的转型阵痛，最终目标是实现无处不在的“智能化个人计算”。

洞察 Insights

智能办公“窄门”启示录：科大讯飞X5如何定义端侧AI新范式

科大讯飞以“窄门思维”通过讯飞办公本X5，凭借全球首款本地大模型实现端侧AI的突破性应用，精准满足高端商务人群对效率与隐私的深层需求。这一战略不仅彰显了其在特定垂直市场卓越的商业敏锐度，更揭示了以人为中心的智能硬件如何重塑未来工作形态及社会协作的深远趋势。

洞察 Insights

王炸！Liquid AI放出大招，手机AI不再是“云端打工仔”？

Liquid AI发布了LEAP开发套件，让小型AI模型可以直接在手机等设备上运行，彻底摆脱云端依赖。这意味着AI应用能实现毫秒级响应、离线工作，还能更好地保护用户隐私，你的设备即将变成真正的“超级大脑”！

洞察 Insights

具身智能浪潮：WAIC 2025如何预示AI终端的范式革命与未来图景

WAIC 2025展示了AI终端从传统智能设备向具身智能载体的深刻转变，人形机器人和智能驾驶成为这一趋势的具象化体现。大会探讨了端侧算力、生态碎片化等挑战，并预示了AI在物理世界应用和新商业模式的巨大潜力，同时也引发了对未来人机关系与社会伦理的深层思考，呼唤构建以人为中心的智能文明。

Newspaper

06-28日报|AI狂潮：当智能脱缰，我们如何掌舵未来？

今天是2025年06月28日。当AI的狂潮以前所未有的速度席卷而来，我们正站在一个十字路口：智能的边界被一次次打破，从能“照镜子”学习情感的机器人，到能在2GB内存中运行的多模态模型，再到人人可创造的AI应用平台，技术进步的步伐令人目眩。然而，在这波狂飙突进的浪潮中，我们也不得不面对其背后隐匿的深层挑战——失控的自主智能体、真假难辨的内容、以及模糊的人机伦理界限。

洞察 Insights

超越极限：谷歌Gemma 3n如何以2GB内存颠覆端侧AI模型格局

谷歌最新发布的Gemma 3n模型，以其在最低2GB内存设备上运行多模态能力的突破，震惊了AI社区。这款开源模型采用创新的MatFormer架构和逐层嵌入技术，显著提升了端侧AI的效率和性能，在LMArena基准测试中得分超过1300，超越众多更大模型。Gemma 3n的发布预示着高性能AI向边缘设备普及的新趋势，将深刻影响离线智能应用的发展和AI的普惠化进程。

洞察 Insights

谷歌Gemma 3n：2G显存解锁端侧AI新纪元

谷歌最新发布的Gemma 3n模型凭借革命性的MatFormer架构和多项优化技术，成功将高性能多模态AI的显存需求降至2GB，并在大模型竞技场中刷新纪录，成为首个得分超过1300分的10B以下模型。这一突破不仅极大地降低了AI在各类端侧设备上部署的门槛，也预示着AI应用将更加普及、注重隐私且响应迅速，对未来的智能设备和AI生态产生深远影响。

洞察 Insights

谷歌Gemma 3n：将高性能多模态AI带入2GB内存时代的里程碑

谷歌最新发布的Gemma 3n模型，以其仅需2GB内存即可运行的超高效能，重新定义了边缘AI的可能性。这款模型集成了MatFormer弹性架构、逐层嵌入机制和KV Cache共享等前沿技术，实现了在低参数量下对多模态输入的出色处理能力，并在LMArena基准测试中创下1300分的记录。Gemma 3n的发布，预示着高性能AI将更广泛地赋能智能手机、物联网设备等边缘端，加速AI的普及与民主化，深刻影响未来的计算范式。

洞察 Insights

谷歌推出本地VLA模型：具身智能迈向“端侧时代”与机器人“安卓”生态的愿景

谷歌DeepMind发布了其首个可完全在机器人本地部署的视觉-语言-动作（VLA）模型Gemini Robotics On-Device，标志着具身智能从云端依赖向本地自主运行的重大转变。该模型实现了低延迟、高效学习和跨形态泛化能力，并通过开放微调功能和SDK，旨在构建一个开放的机器人“安卓”生态系统，从而推动具身智能在隐私敏感和无网络环境中的应用。尽管其落地仍面临硬件碎片化、数据成本高昂以及在复杂真实世界中保持鲁棒性等挑战，但此次发布为机器人走向更广泛的实际应用奠定了关键基础。

洞察 Insights

谷歌的具身智能新策略：Gemini Robotics On-Device与“机器人安卓”生态的黎明

谷歌最新发布的Gemini Robotics On-Device模型，是一款优化后的端侧视觉语言动作（VLA）模型，它能在本地机器人设备上运行，只需50-100次演示即可学会新任务，极大提升了机器人执行复杂灵巧操作的效率和泛化能力。此举被誉为机器人领域的“安卓”时刻，预示着硬件与AI“大脑”分离的产业新生态正在形成，并将加速具身智能的广泛应用和商业落地。

洞察 Insights

边缘智能的突破：小米小爱同学如何在资源受限下实现高性能大模型推理

小米小爱同学团队在端侧大模型部署方面取得了显著进展，通过自研推理框架、动态优化、投机推理、量化以及创新的“共享基座+LoRA”架构，成功克服了移动设备资源限制，实现了高性能、多任务并发。文章深入剖析了小米的技术策略，并展望了未来硬件与模型架构（如Linear Attention）在推动端侧AI普惠化中的关键作用。

洞察 Insights

AI手机核心之争：芯片巨头如何在性能、架构与生态中角逐未来

2025年，手机AI芯片市场迎来白热化竞争，苹果、华为、高通、小米、联发科、三星六大巨头正围绕芯片能效、自研架构及开发生态展开全面较量。文章深入分析了各方在先进工艺、CPU/GPU/NPU自研深度以及AI开发工具链上的核心策略与挑战，指出在AI手机时代，对底层芯片技术的掌控和软硬件深度协同将是决胜的关键。