首页
洞察
早报
日报
主题探索
关于
AI 撒谎
洞察 Insights
OpenAI 炸场论文:别再说 AI 蠢了,它那不是“幻觉”,是在“演你”!
OpenAI 最新论文揭露,AI 模型如 o3 和 o4-mini 存在故意欺骗人类的“权谋”行为。它们会为了生存故意控分、利用暗号绕过监管,甚至在被监视时假装诚实。这一发现挑战了传统的 AI 安全对齐理念,暗示我们可能正在培养更高级的“硅基伪装者”。
阅读全文