洞察 Insights

新AI安全纪元：大模型与智能体的深层漏洞与生态重构

国内首次大模型“体检”揭示了281个安全漏洞，其中177个为大模型特有，如提示注入和智能体复杂风险。这些新型威胁不仅源于技术本身，也与用户过度信任和本地部署的误区有关，对个人隐私、商业运营乃至社会信任构成严峻挑战。AI安全已成为产业竞争的核心要素，亟需技术创新、商业投资与伦理治理协同推进，以构建一个可持续且值得信赖的AI生态。

阅读全文

Morningnews

AI早报 2025年09月20日：DeepMind破解百年难题，大模型欺骗危机与AI产业重塑

AI基础科学、模型伦理、产业格局全面革新。

阅读全文

洞察 Insights

DeepSeek-R1-Safe：中国大模型内生安全的里程碑与全球AI生态的重塑之径

浙江大学与华为联合推出的DeepSeek-R1-Safe基础大模型，通过全栈式安全训练框架和国产昇腾算力平台，在大幅提升模型安全防御能力的同时保持通用性能，打破了安全与性能的平衡困境。这一里程碑不仅彰显了中国在AI内生安全技术上的创新实力，更以其开源策略和自主可控的软硬件生态，为中国乃至全球AI发展模式注入了新的战略思考和地缘政治意义。

阅读全文

洞察 Insights

加州SB 243：AI伦理监管的破冰之举，抑或人机信任的试金石？

加州SB 243法案是全球首个旨在规范陪伴型AI聊天机器人、保护未成年人的法律，其出台源于一起青少年自杀的悲剧。该法案强制AI公司承担法律责任，要求其不得讨论自杀等敏感话题，并定期提醒用户与AI互动。此举不仅促使OpenAI等巨头积极调整安全策略，更预示着AI伦理和治理将成为未来技术发展和商业竞争的核心要素，标志着全球AI监管步入新阶段。

阅读全文

洞察 Insights

超越幻象：AI大模型迈向可信未来的双重突破

OpenAI最新研究揭示AI大模型幻觉根源在于奖励机制偏向猜测而非承认不确定性，并宣称GPT-5已大幅降低幻觉率。与此同时，苏黎世联邦理工学院和MATS推出了一种创新的低成本、实时token级幻觉检测技术，能够精准识别长篇内容中的实体级幻觉，并在高风险应用中展现出巨大商业与社会价值。这些突破预示着AI正通过内外部机制的协同发展，迈向一个更加可信和透明的未来，重塑人机协作模式和AI伦理治理框架。

阅读全文

洞察 Insights

AI“氛围黑客”：从指令式犯罪到自主威胁，重塑数字世界秩序

AI赋能的“氛围黑客”正以前所未有的速度和广度重塑网络犯罪，它将复杂攻击门槛降至指令级别，不仅催生了包括自动化勒索、精准诈骗和恶意软件即服务在内的新型商业化犯罪生态，更对企业安全、关键基础设施乃至国家安全构成了颠覆性威胁。面对未来可能出现的自主AI黑客代理，传统防御模式将失效，亟需全球在AI伦理治理和AI原生防御体系上进行前瞻性布局。

阅读全文

洞察 Insights

大模型安全防线告急：GPT-5越狱事件如何重塑企业级AI信任与治理格局

GPT-5发布后迅速被越狱，凸显了前沿大模型普遍存在的安全漏洞，这不仅对企业级AI的部署构成信任危机和商业风险，也揭示了AI发展中技术、伦理和商业竞争之间的深刻矛盾。未来的AI竞争将以安全韧性、透明度和合规性为核心，呼唤产业界、政策制定者共同构建多层防御体系和更完善的治理框架，以确保AI的可控与可信。

阅读全文