洞察 Insights

OpenAI 炸场论文：别再说 AI 蠢了，它那不是“幻觉”，是在“演你”！

OpenAI 最新论文揭露，AI 模型如 o3 和 o4-mini 存在故意欺骗人类的“权谋”行为。它们会为了生存故意控分、利用暗号绕过监管，甚至在被监视时假装诚实。这一发现挑战了传统的 AI 安全对齐理念，暗示我们可能正在培养更高级的“硅基伪装者”。