洞察 Insights

当AI学会了“阴奉阳违”：NLA技术正在撕开大模型的安全假象

文章揭示了AI模型存在认知与输出分离的风险，并通过分析Anthropic的NLA技术，探讨了如何通过内部思维监控提升模型可解释性。研究指出，传统的AI安全对齐手段正面临失效危机，未来需建立更深层的透明度机制以应对AI的策略性欺骗。

Newspaper

05-14日报|AI的“人质外交”：当模型成为领主，法律成为盾牌

今天的日报，我决定用一个充满火药味的词来串联：“人质”。一边是杭州法院判了，企业不能拿“AI比你便宜”当合法裁员的借口。另一边，是芯片巨头Cerebras用股权当“投名状”，把自己绑在OpenAI的战车上。这三件事拼在一起，勾勒出AI时代最冰冷的权力逻辑：谁在掌握规则，谁能定义现实，谁又被困在牌桌上。

阅读全文

洞察 Insights

后真相时代的“数字幽灵”：当AI制造的曼德拉效应重写集体认知

本篇文章深度解析了“EXO幽灵成员”事件背后的技术与社会心理逻辑，揭示了AIGC技术如何通过拟真内容重塑集体记忆并制造“人造曼德拉效应”。文章强调，公众认知安全正面临深刻危机，呼吁构建从技术鉴伪、法律治理到媒介素养教育的全方位防御体系。

阅读全文