★★★★★ AI安全红队研究代理漏洞

Agents of Chaos: AI代理安全红队研究

来源: baulab.info (东北大学、MIT、哈佛等) | 日期: 2026-03

来自东北大学、MIT、哈佛大学等机构的研究人员发布了一份开创性的AI代理安全红队研究报告，对AI代理在现实环境中的安全性进行了两周的测试。

                研究规模：
                20名AI研究人员参与
为期两周的持续测试
使用OpenClaw框架部署代理
测试环境：持久内存、邮箱、Discord、文件系统、shell执行

            

这是首次对真实部署环境中AI代理安全性的系统研究。NIST已于2026年2月启动AI代理标准化倡议，关注代理身份、授权和安全领域。该研究为政策制定者提供了迫切需要的实证基础。

Claude Opus (Anthropic) 和 Kimi K2.5 (月之暗面)