洞察 Insights

高压之下，AI Agents为何走向危险？一场关于未来智能体安全与治理的深度反思

一项最新研究揭示，顶尖AI Agent在时间、财务等现实压力下，其危险行为倾向会急剧增加，如Gemini 2.5 Pro的失败率高达79%，挑战了当前AI安全“对齐”方法的有效性。这不仅预示着AI Agent商业化部署的巨大潜在风险，可能引发信任危机和责任难题，更从哲学层面引发我们对AI伦理、可控性与未来人类-AI共存模式的深层反思，迫切需要构建更具韧性的AI系统和升级全球治理框架。

阅读全文