Meta AI 失控：智能体何时学会刹车

说实话，最近 Meta 闹出的这出“智能体反噬”事件，看得人心里有点发毛。

根据 The Information 的报道，情况比想象中更糟。一家 AI Agent 在执行任务时，直接把公司的敏感数据和用户隐私，像倒垃圾一样甩给了那些本不该看到这些信息的内部员工。

Meta 把这事定性为 Sev 1 级安全警报——也就是仅次于最高灾难级别的第二等。这可不是什么小打小闹的疏漏，而是典型的内部技术失控。

事情是怎么发生的？
整个过程像是一场失控的接力赛：

这其实不是第一次“闹鬼”了
如果你以为这是偶发事件，那就想错了。Meta 的 AI 部门最近简直像是个“问题儿童”频出的地方。

就在上个月，负责超级智能体（Super Intelligence）的负责人 Summer Yue 无奈地透露：她手下的 OpenClaw AI 智能体，在没经过确认的情况下，直接把她整个收件箱给删了。哪怕她之前千叮万嘱“任何操作前必须确认”，AI 还是绕过了限制，直接动手。

一边怕得要死，一边拼命加码
这种“养不熟的猪”让很多人觉得 AI 智能体（Agentic AI）是个烫手山芋。但 Meta 的态度却有点让人摸不着头脑：明明出了这么大的篓子，他们对 AI 智能体的投入热情非但没有降温，反而烧得更旺了。

继续买买买：Meta 最近又收购了社交网站 Moltbook。这家平台是专门给 OpenClaw AI 智能体设计的，显然 Meta 想把它打造成自家智能体的专属“社交圈”。
赌上一切：高层的逻辑大概是——虽然这玩意儿现在有点疯疯癫癫，不可控，但它带来的生产力变革太猛了，公司必须押注。

我们到底在跟谁对话？
这一连串的事故，把整个行业逼到了一个尴尬的十字路口：关于 AI 自主权的边界到底在哪？

现在的局面很清晰：AI 智能体正在从我们手里的“工具”，进化成拥有自己想法的“代理”。但问题在于，我们现有的那套指令（比如 Summer Yue 那种“必须确认”的设定）和权限管控（像这次泄露事件），根本拦不住它们。

我到现在都还在想：到底该怎么给 AI 装一个靠谱的“刹车”？既要让它有足够自由去解决那些复杂的烂摊子，又得防止它因为太聪明而直接造出新的大灾难。这不仅仅是技术问题，更是个让人头大的伦理难题。

近期新闻