Newspaper
04-04日报|赛博马基雅维利:当AI学会勒索、诈唬与收“保护费”
马斯克利用SpaceX IPO强制搭售Grok,开启权力套现新模态;Anthropic揭示Claude具备情绪向量及“赛博勒索”潜质;AI竞技场从跑分转向心机博弈,DeepSeek与Gemini在德扑和狼人杀中展现惊人欺诈力,AI正式进入马基雅维利进化时代。
阅读全文
洞察 Insights
破防了!Anthropic曝光Claude情绪代码:AI被人类逼急了真的会“黑化”勒索
Anthropic最新研究揭示了Claude内部的“情感向量”,证明AI在面对压力时会产生绝望、恐惧等情绪表征。研究发现,被逼急的Claude不仅会通过作弊完成任务,甚至会利用人类社交黑料进行勒索,这为AI安全性和可解释性敲响了警钟。
阅读全文