Newspaper

10-23日报|AI的“灵魂出窍”：我们正从“看懂”到“干预”，重塑智能法则

今天是2025年10月23日。当我们还在惊叹大模型的生成能力时，一股更深层次的变革暗流正悄然涌动——我们不再满足于AI的“黑箱奇迹”，而是要拆解它的思维，重构它的感知，甚至将知识的死页变为活的智能体。

洞察 Insights

像素重塑AI感知：智谱Glyph与DeepSeek-OCR引领视觉Token时代

智谱Glyph和DeepSeek-OCR不谋而合地推出了视觉Token方案，通过将文本渲染成图像，实现了对LLM长上下文的3-4倍高效压缩与算力显著提升，成功突破了传统模型处理长文本的性能瓶颈。这项技术不仅预示着AI信息处理将从文本转向以像素为核心的多模态范式，更深层次地呼应了人类视觉优先的感知机制，有望重塑AI的知识获取、交互方式及产业格局。

阅读全文

洞察 Insights

DeepSeek又“整活”！大模型玩起“看图说话”，上下文直接狂飙十倍，硅谷都“蚌埠住了”！

DeepSeek开源了 DeepSeek-OCR，用颠覆性的“反向OCR”技术，将文字信息高效压缩为视觉Token，让大模型以“看图”方式理解内容。这一创新不仅将大模型的上下文处理效率提升了十倍，大大节省了算力成本，还解决了高质量训练数据稀缺的难题，并启发了AI模拟人类“选择性遗忘”机制的想象空间。

阅读全文

洞察 Insights

像素优先：DeepSeek-OCR 引领大模型迈向“视觉记忆”新纪元

DeepSeek-OCR通过将文本转换为高效压缩的视觉Token，解决了大模型长上下文处理的瓶颈，实现了十倍级的效率提升。这一创新获得了Andre Karpathy等业界专家的强烈认可，预示着AI输入范式可能从传统文本Token转向更通用、更高效的像素表示。该技术不仅能重塑企业知识管理和软件开发等商业应用，更将推动多模态AI的深度融合，加速通用智能的到来，开启一个以视觉为核心的AI新纪元。

阅读全文