洞察 Insights
DeepSeek稀疏注意力:破解长上下文成本魔咒,重塑AI普惠经济学
DeepSeek V3.2-Exp模型凭借突破性的DeepSeek稀疏注意力(DSA)机制,成功解决了大模型长上下文处理的高成本难题,在不牺牲性能的前提下大幅提升效率并降低API价格超过50%。这不仅加速了AI应用的普惠化进程,更预示着未来AI发展将从纯粹的模型规模竞赛转向对极致效率和成本效益的深度优化,从而重塑产业生态并推动更高级智能体的实现。
阅读全文
洞察 Insights
深夜“王炸”!阿里大模型成本“膝盖斩”90%,这波操作太“顶”了!
阿里通义深夜发布Qwen3-Next新架构,以800亿总参数、仅激活30亿参数的“神操作”,实现了训练成本暴降90%和推理吞吐量10倍以上飞跃。这款新模型在性能上直逼甚至超越现有旗舰,通过混合注意力、高稀疏MoE等技术,为大模型“降本增效”开辟了新路径,引领行业进入“性价比之争”的新阶段。
阅读全文
Newspaper
08-11日报|AI的“双面”帝国:从国家抽成的枷锁到算力普惠的火种
今天是2025年08月11日。围绕AI算力的剧变与博弈正深刻上演:美国政府对AI芯片出口征收15%“通行费”,将技术贸易演变为国家层面的利润分润与战略控制;同时,OpenAI的MXFP4技术将大模型推理成本骤降75%,以软件创新实现AI能力普惠化,重塑算力版图。
阅读全文
洞察 Insights
MiniMax 进化论:一群「偏执者」的破浪前行
MiniMax正在以其对前沿模型架构与训练算法的“偏执”探索,重塑大模型行业的竞争格局。该公司最新发布的Hailuo 02视频模型和M1长上下文大模型,不仅实现了技术上的重大突破,更通过Hailuo Video Agent和通用MiniMax Agent等应用,将底层创新高效转化为可量化的商业价值和生产力,展现了创业公司如何在技术驱动下挣脱巨头引力。
阅读全文
洞察 Insights
MiniMax的AI成本革命:53万美元如何塑造下一代智能体未来
MiniMax通过独创的Lightning Attention混合架构和CISPO强化学习算法,将顶级AI模型的强化训练成本大幅降低至53.74万美元,实现了百万级上下文处理能力和卓越的Agent工具调用表现。这一技术突破不仅显著降低了AI研发门槛,更为智能体技术的广泛应用和AI市场的未来增长注入了强大信心。
阅读全文
洞察 Insights
字节跳动的AI Agent豪赌:重塑数字未来的关键战役
字节跳动正将全部赌注押向AI Agent这一新兴范式,旨在通过火山引擎在云计算市场实现“换道超车”,以应对AI时代对传统App模式的颠覆。此举不仅涉及豆包大模型的迭代与成本优化,更在于构建一套完整的AI云原生基础设施,以期在激烈的竞争和未知的挑战中,抢占下一代互联网的核心入口,实现其长期AGI愿景。
阅读全文