Claude Mythos 评测:我们该害怕吗?Claude Mythos, evaluated
本文对 Anthropic 新发布的 Claude Mythos 模型进行了全面评估,重点分析其在复杂推理任务上的表现。评测发现该模型在数学、逻辑和代码生成方面显著优于前代产品,但在事实一致性和长上下文理解上仍有缺陷。作者认为 Mythos 代表了当前大语言模型的进步,但尚未达到 AGI 水平,公众无需过度恐慌。
Gary Marcus
英国人工智能安全研究所对尚未公开推出的 Claude Mythos Preview 进行了非常有趣的评估。
从积极的一面来看,就目前的形式而言,Myth 远没有汤姆·弗里德曼(他担心孩子们会意外摧毁电网)等人所渲染的那么可怕。
但从消极的一面看,它确实比 Mythos 的前代产品更大幅度地增强了攻击者的能力。
下面是在 X 平台(原 Twitter)上最令人担忧的部分:
AI Security Institute@AISecurityInst
我们对 Claude Mythos Preview 进行了网络安全评估,发现它是首个在 AISI 网络靶场中完成端到端测试的模型。🧵
下午 1:31 · 2026年4月13日 · 20.9万次观看
39条回复 · 202次转发 · 1,180个点赞
而这里(见第二段)提供了一些安慰:
AI Security Institute@AISecurityInst
2023年时,最先进的模型几乎无法完成入门级网络任务。如今,我们对 Mythos Preview 的评估表明,只要赋予其网络访问权限,它——以及未来可能出现的模型——就可能被用来自主攻陷那些规模小、防御薄弱且存在漏洞的系统。
下午 1:31 · 2026年4月13日 · 8,390次观看
1条回复 · 91个点赞
但愿如今已没有任何关键基础设施是“规模小、防御薄弱且存在漏洞”并开放网络访问权限的。但愿如此。
你可以在此处阅读完整报告。
我认同他们的结论:
AI Security Institute@AISecurityInst
这些结果凸显了网络安全基础的重要性,例如定期安全更新、访问控制、安全配置和日志记录。
下午 1:31 · 2026年4月13日 · 7,520次观看
1条回复 · 57个点赞
即便 Mythos 在媒体宣传中被有些夸大其词,现在(或者更理想地说应是去年)正是我们整顿网络安全的时候——尤其是考虑到如今大量由智能体生成的代码本身就可能既防御薄弱又存在漏洞。
暂无帖子
需要完整排版与评论请前往来源站点阅读。