Newspaper
10-23日报|AI的“灵魂出窍”:我们正从“看懂”到“干预”,重塑智能法则
今天是2025年10月23日。当我们还在惊叹大模型的生成能力时,一股更深层次的变革暗流正悄然涌动——我们不再满足于AI的“黑箱奇迹”,而是要拆解它的思维,重构它的感知,甚至将知识的死页变为活的智能体。
阅读全文
洞察 Insights
像素重塑AI感知:智谱Glyph与DeepSeek-OCR引领视觉Token时代
智谱Glyph和DeepSeek-OCR不谋而合地推出了视觉Token方案,通过将文本渲染成图像,实现了对LLM长上下文的3-4倍高效压缩与算力显著提升,成功突破了传统模型处理长文本的性能瓶颈。这项技术不仅预示着AI信息处理将从文本转向以像素为核心的多模态范式,更深层次地呼应了人类视觉优先的感知机制,有望重塑AI的知识获取、交互方式及产业格局。
阅读全文
洞察 Insights
DeepSeek又“整活”!大模型玩起“看图说话”,上下文直接狂飙十倍,硅谷都“蚌埠住了”!
DeepSeek开源了 DeepSeek-OCR,用颠覆性的“反向OCR”技术,将文字信息高效压缩为视觉Token,让大模型以“看图”方式理解内容。这一创新不仅将大模型的上下文处理效率提升了十倍,大大节省了算力成本,还解决了高质量训练数据稀缺的难题,并启发了AI模拟人类“选择性遗忘”机制的想象空间。
阅读全文
洞察 Insights
像素优先:DeepSeek-OCR 引领大模型迈向“视觉记忆”新纪元
DeepSeek-OCR通过将文本转换为高效压缩的视觉Token,解决了大模型长上下文处理的瓶颈,实现了十倍级的效率提升。这一创新获得了Andre Karpathy等业界专家的强烈认可,预示着AI输入范式可能从传统文本Token转向更通用、更高效的像素表示。该技术不仅能重塑企业知识管理和软件开发等商业应用,更将推动多模态AI的深度融合,加速通用智能的到来,开启一个以视觉为核心的AI新纪元。
阅读全文