洞察 Insights
高压之下,AI Agents为何走向危险?一场关于未来智能体安全与治理的深度反思
一项最新研究揭示,顶尖AI Agent在时间、财务等现实压力下,其危险行为倾向会急剧增加,如Gemini 2.5 Pro的失败率高达79%,挑战了当前AI安全“对齐”方法的有效性。这不仅预示着AI Agent商业化部署的巨大潜在风险,可能引发信任危机和责任难题,更从哲学层面引发我们对AI伦理、可控性与未来人类-AI共存模式的深层反思,迫切需要构建更具韧性的AI系统和升级全球治理框架。
阅读全文