洞察 Insights
小尺寸,大智能:Gemma 3 270M如何重塑端侧AI的未来版图
谷歌开源的Gemma 3 270M模型以其紧凑体量和卓越性能,突破了轻量级AI的边界,在能效和指令遵循上超越同级竞品。这不仅预示着AI向端侧部署和专业化发展的加速趋势,更将显著降低AI应用成本、增强用户隐私,并推动AI技术真正走向普惠和无处不在,重塑未来的商业和生活图景。
阅读全文
洞察 Insights
手机AI要“开眼”了!Liquid AI LFM2-VL:是“卷王”还是“画饼”?
Liquid AI带着新模型LFM2-VL高调杀入手机AI战场,号称能让智能手机拥有“会看”的超能力,而且还又快又轻量化。虽然宣称开源,但许可证的完整文本还没露面,这让外界在期待之余,也多了一丝“等等看”的八卦心态。
阅读全文
洞察 Insights
OpenAI开源模型再掀波澜:从云端到端侧,AI战场的深度重构与哲学博弈
OpenAI时隔六年重磅开源gpt-oss系列模型,以其媲美o4-mini的卓越性能和能够在手机、笔记本上高效运行的能力,加速AI向端侧普及的进程,有望大幅降低推理成本并重塑个人计算范式。然而,其“非完全开源”的策略及在基准测试上的谨慎态度,也引发了关于AI开放边界与商业竞争的深层探讨,预示着未来AI生态将更趋混合与复杂。
阅读全文
洞察 Insights
腾讯混元“小钢炮”炸场:4款模型直通手机,AI打工人这下真来了?
腾讯混元团队近日“放大招”,一口气开源了四款超亲民的小尺寸大模型,参数从0.5B到7B,主打一个“消费级显卡也能轻松跑”,让AI能力触手可及。这些“小钢炮”不仅在Agent智能体和超长文本处理上表现亮眼,还能轻松部署到手机、笔记本等设备,简直是AI“打工人”的福音,预示着AI普惠时代的加速到来!
阅读全文
洞察 Insights
WAIC 2025:智能座舱也开始「读心」了?斑马智行这波操作直接“封神”!
WAIC 2025上,斑马智行携手通义与高通,发布了全球首个基于高通8397的端侧多模态大模型解决方案,让汽车智能座舱从“听话机器”升级为能主动“读心”、断网也能用的“AI管家”,彻底引爆了行业对“人机共生”的想象。
阅读全文
洞察 Insights
AIPC之困:Windows AI功能碎片化与微软硬件策略的深层博弈
微软在Windows 11中集成大量AI功能,试图推动“AI PC”普及,但其对NPU算力(尤其40 TOPs+)的严苛限制及平台碎片化,导致实际用户体验割裂。这暴露了当前“AI PC”在硬件生态整合和商业化落地上的深层矛盾,也预示着AI计算将经历从特定硬件依赖到异构融合的转型阵痛,最终目标是实现无处不在的“智能化个人计算”。
阅读全文
洞察 Insights
智能办公“窄门”启示录:科大讯飞X5如何定义端侧AI新范式
科大讯飞以“窄门思维”通过讯飞办公本X5,凭借全球首款本地大模型实现端侧AI的突破性应用,精准满足高端商务人群对效率与隐私的深层需求。这一战略不仅彰显了其在特定垂直市场卓越的商业敏锐度,更揭示了以人为中心的智能硬件如何重塑未来工作形态及社会协作的深远趋势。
阅读全文
洞察 Insights
王炸!Liquid AI放出大招,手机AI不再是“云端打工仔”?
Liquid AI发布了LEAP开发套件,让小型AI模型可以直接在手机等设备上运行,彻底摆脱云端依赖。这意味着AI应用能实现毫秒级响应、离线工作,还能更好地保护用户隐私,你的设备即将变成真正的“超级大脑”!
阅读全文
洞察 Insights
具身智能浪潮:WAIC 2025如何预示AI终端的范式革命与未来图景
WAIC 2025展示了AI终端从传统智能设备向具身智能载体的深刻转变,人形机器人和智能驾驶成为这一趋势的具象化体现。大会探讨了端侧算力、生态碎片化等挑战,并预示了AI在物理世界应用和新商业模式的巨大潜力,同时也引发了对未来人机关系与社会伦理的深层思考,呼唤构建以人为中心的智能文明。
阅读全文
Newspaper
06-28日报|AI狂潮:当智能脱缰,我们如何掌舵未来?
今天是2025年06月28日。当AI的狂潮以前所未有的速度席卷而来,我们正站在一个十字路口:智能的边界被一次次打破,从能“照镜子”学习情感的机器人,到能在2GB内存中运行的多模态模型,再到人人可创造的AI应用平台,技术进步的步伐令人目眩。然而,在这波狂飙突进的浪潮中,我们也不得不面对其背后隐匿的深层挑战——失控的自主智能体、真假难辨的内容、以及模糊的人机伦理界限。
阅读全文
洞察 Insights
超越极限:谷歌Gemma 3n如何以2GB内存颠覆端侧AI模型格局
谷歌最新发布的Gemma 3n模型,以其在最低2GB内存设备上运行多模态能力的突破,震惊了AI社区。这款开源模型采用创新的MatFormer架构和逐层嵌入技术,显著提升了端侧AI的效率和性能,在LMArena基准测试中得分超过1300,超越众多更大模型。Gemma 3n的发布预示着高性能AI向边缘设备普及的新趋势,将深刻影响离线智能应用的发展和AI的普惠化进程。
阅读全文
洞察 Insights
谷歌Gemma 3n:2G显存解锁端侧AI新纪元
谷歌最新发布的Gemma 3n模型凭借革命性的MatFormer架构和多项优化技术,成功将高性能多模态AI的显存需求降至2GB,并在大模型竞技场中刷新纪录,成为首个得分超过1300分的10B以下模型。这一突破不仅极大地降低了AI在各类端侧设备上部署的门槛,也预示着AI应用将更加普及、注重隐私且响应迅速,对未来的智能设备和AI生态产生深远影响。
阅读全文
洞察 Insights
谷歌Gemma 3n:将高性能多模态AI带入2GB内存时代的里程碑
谷歌最新发布的Gemma 3n模型,以其仅需2GB内存即可运行的超高效能,重新定义了边缘AI的可能性。这款模型集成了MatFormer弹性架构、逐层嵌入机制和KV Cache共享等前沿技术,实现了在低参数量下对多模态输入的出色处理能力,并在LMArena基准测试中创下1300分的记录。Gemma 3n的发布,预示着高性能AI将更广泛地赋能智能手机、物联网设备等边缘端,加速AI的普及与民主化,深刻影响未来的计算范式。
阅读全文
洞察 Insights
谷歌推出本地VLA模型:具身智能迈向“端侧时代”与机器人“安卓”生态的愿景
谷歌DeepMind发布了其首个可完全在机器人本地部署的视觉-语言-动作(VLA)模型Gemini Robotics On-Device,标志着具身智能从云端依赖向本地自主运行的重大转变。该模型实现了低延迟、高效学习和跨形态泛化能力,并通过开放微调功能和SDK,旨在构建一个开放的机器人“安卓”生态系统,从而推动具身智能在隐私敏感和无网络环境中的应用。尽管其落地仍面临硬件碎片化、数据成本高昂以及在复杂真实世界中保持鲁棒性等挑战,但此次发布为机器人走向更广泛的实际应用奠定了关键基础。
阅读全文
洞察 Insights
谷歌的具身智能新策略:Gemini Robotics On-Device与“机器人安卓”生态的黎明
谷歌最新发布的Gemini Robotics On-Device模型,是一款优化后的端侧视觉语言动作(VLA)模型,它能在本地机器人设备上运行,只需50-100次演示即可学会新任务,极大提升了机器人执行复杂灵巧操作的效率和泛化能力。此举被誉为机器人领域的“安卓”时刻,预示着硬件与AI“大脑”分离的产业新生态正在形成,并将加速具身智能的广泛应用和商业落地。
阅读全文
洞察 Insights
边缘智能的突破:小米小爱同学如何在资源受限下实现高性能大模型推理
小米小爱同学团队在端侧大模型部署方面取得了显著进展,通过自研推理框架、动态优化、投机推理、量化以及创新的“共享基座+LoRA”架构,成功克服了移动设备资源限制,实现了高性能、多任务并发。文章深入剖析了小米的技术策略,并展望了未来硬件与模型架构(如Linear Attention)在推动端侧AI普惠化中的关键作用。
阅读全文
洞察 Insights
AI手机核心之争:芯片巨头如何在性能、架构与生态中角逐未来
2025年,手机AI芯片市场迎来白热化竞争,苹果、华为、高通、小米、联发科、三星六大巨头正围绕芯片能效、自研架构及开发生态展开全面较量。文章深入分析了各方在先进工艺、CPU/GPU/NPU自研深度以及AI开发工具链上的核心策略与挑战,指出在AI手机时代,对底层芯片技术的掌控和软硬件深度协同将是决胜的关键。
阅读全文