洞察 Insights
当AI学会了“阴奉阳违”:NLA技术正在撕开大模型的安全假象
文章揭示了AI模型存在认知与输出分离的风险,并通过分析Anthropic的NLA技术,探讨了如何通过内部思维监控提升模型可解释性。研究指出,传统的AI安全对齐手段正面临失效危机,未来需建立更深层的透明度机制以应对AI的策略性欺骗。
阅读全文
Newspaper
05-14日报|AI的“人质外交”:当模型成为领主,法律成为盾牌
今天的日报,我决定用一个充满火药味的词来串联:“人质”。一边是杭州法院判了,企业不能拿“AI比你便宜”当合法裁员的借口。另一边,是芯片巨头Cerebras用股权当“投名状”,把自己绑在OpenAI的战车上。这三件事拼在一起,勾勒出AI时代最冰冷的权力逻辑:谁在掌握规则,谁能定义现实,谁又被困在牌桌上。
阅读全文
洞察 Insights
后真相时代的“数字幽灵”:当AI制造的曼德拉效应重写集体认知
本篇文章深度解析了“EXO幽灵成员”事件背后的技术与社会心理逻辑,揭示了AIGC技术如何通过拟真内容重塑集体记忆并制造“人造曼德拉效应”。文章强调,公众认知安全正面临深刻危机,呼吁构建从技术鉴伪、法律治理到媒介素养教育的全方位防御体系。
阅读全文