返回 2026-06-14
🤖 AI / ML

美国政府以国家安全为由指示 Anthropic 关闭 Fable 5 和 Mythos 5 模型U.S. Government Directs Anthropic to Shut Down Fable 5 and Mythos 5 Models on National Security Grounds

daringfireball.net·2026-06-13

美国政府向 Anthropic 下达出口管制指令,要求暂停任何外国公民(包括 Anthropic 内部的非美籍员工)对 Fable 5 和 Mythos 5 模型的访问权限。为确保完全合规,Anthropic 被迫突然为所有客户全面禁用这两款模型。不过,该指令并未影响 Anthropic 其他模型的正常访问。这一突发事件标志着 AI 出口管制已经从政策讨论直接转变为对前沿模型访问的硬性切断。

美国政府以国家安全职权为由,发布了一项出口管制指令,暂停任何外国公民(无论其身处美国境内还是境外,包括外籍的 Anthropic 员工)访问 Fable 5 和 Mythos 5 的所有权限。该指令带来的最终结果是,为了确保合规,我们必须立即为所有客户停用 Fable 5 和 Mythos 5。对所有其他 Anthropic 模型的访问将不受影响。

我们于今天下午 5:21(美东时间)收到了政府的指令。信中并未提供其国家安全担忧的具体细节。我们的理解是,政府认为自己发现了一种绕过或“越狱”(jailbreaking)Fable 5 的方法。我们审查了使用该特定技术来识别少量已知轻微漏洞的演示。这些漏洞看起来都相对简单,而且我们发现其他公开可用的模型同样能够发现这些漏洞,无需使用任何绕过手段。

正如我们在发布博客文章中所阐述的,Anthropic 对 Fable 安全防护措施的立场如下:

  • 我们已经实施了强有力的安全防护措施,极大地降低了 Fable 被滥用于网络安全等相关任务的可能性。事实上,我们的防护措施非常严格,以至于许多用户抱怨它们限制得过于宽泛。
  • 在 Fable 发布前的几周里,Anthropic 与美国政府、英国 AISI、多家私营第三方组织以及内部团队进行了合作,累计花费数千小时对 Fable 的安全防护措施进行了红队测试。
  • 这些测试表明,Fable 的安全防护措施比以往任何已部署的模型都要有效得多。
  • 到目前为止,还没有测试人员能够找到一种通用的越狱方法——即能够大范围绕过模型安全防护、解锁大量网络能力的越狱手段。
  • 我们认为,目前任何模型提供商都不可能做到完美抵御越狱。业内使用的每一项安全防护措施都容易受到非通用越狱的攻击(这类攻击可以在特定情况下诱出某些网络信息),而且未来很可能最终会找到通用的越狱方法。我们在发布 Fable 5 时就已经明确说明了这一点。
  • 鉴于目前似乎无法实现完美抵御越狱,Anthropic 在 Fable 5 上采取了纵深防御策略。我们的目标是让越狱要么范围有限(对于非通用越狱而言),要么开发成本极高(对于通用越狱而言),并将此与全面的监控相结合,以快速检测并封堵任何成功的攻击。这也是为什么 Anthropic 要求将 Fable 的客户数据保留 30 天的原因——这一政策变更给我们与客户的关系带来了实际成本,但却使我们能够研究并缓解越狱问题。
  • 我们坚持这一纵深防御策略。它降低了 Fable 带来的风险,使其与整个行业中已部署的现有模型风险相当。
  • 我们甚至没有收到过任何关于令人担忧的、且导致了有害结果的非通用潜在越狱的报告。向我们披露的潜在越狱,要么完全是良性的响应,要么是一些不能为 Mythos 提供任何特定能力提升的次要发现。
  • 迄今为止,政府仅向我们提供了一种潜在的范围有限且非普遍的越狱漏洞的口头证据,其本质上只是要求模型读取特定代码库并修复其中的软件缺陷。据我们了解,有人向政府分享了一种潜在的越狱方法。我们审查了一份报告,我们认为该报告正是政府下达指令的依据,并证实其中所展现的能力水平在其他模型(包括 OpenAI 的 GPT-5.5)中早已广泛普及,且被维护系统安全的防御人员每天都在使用。我们将在接下来的 24 小时内分享更多细节。

    我们正在遵守政府的法律指令,并面向所有用户停止提供 Fable 5 和 Mythos 5 的访问权限。然而,我们不认同仅仅因为发现了一个范围有限的潜在越狱漏洞,就应该召回一款已向数亿人部署的商业模型。如果整个行业都采用这一标准,我们认为这将实质性地叫停所有前沿模型提供商部署任何新模型。

    正如我们此前公开声明的那样,我们认为政府应当有权在透明、公平、清晰且以技术事实为依据的法定程序中,叫停不安全的部署。但此次行动并未遵循这些原则。

    我们对由此给客户造成的服务中断深表歉意。我们认为这是一场误解,并正在努力尽快恢复访问权限。

    相关内容

    首次 Anthropic Public Record 的结果

    阅读更多

    TCS 与 Anthropic 建立合作伙伴关系,将 Claude 引入受监管行业

    我们宣布与 Tata Consultancy Services (TCS) 建立合作伙伴关系。TCS 将向其在 56 个国家的 50,000 名员工提供 Claude;为金融服务、医疗保健、公共部门及其他受监管行业的客户打造基于 Claude 的产品;并将加入 Claude Partner Network。

    阅读更多

    DXC 将把 Claude 集成到银行、航空公司及其他受监管行业所依赖的系统中

    我们宣布与全球最大的 IT 服务公司之一 DXC Technology 达成一项为期多年的全球合作联盟。

    阅读更多

    需要完整排版与评论请前往来源站点阅读。