首页
洞察
早报
日报
主题探索
关于
共享基座模型
洞察 Insights
边缘智能的突破:小米小爱同学如何在资源受限下实现高性能大模型推理
小米小爱同学团队在端侧大模型部署方面取得了显著进展,通过自研推理框架、动态优化、投机推理、量化以及创新的“共享基座+LoRA”架构,成功克服了移动设备资源限制,实现了高性能、多任务并发。文章深入剖析了小米的技术策略,并展望了未来硬件与模型架构(如Linear Attention)在推动端侧AI普惠化中的关键作用。
阅读全文