返回 2026-04-18
🤖 AI / ML

Claude Opus 4.6 到 4.7 的系统提示变更Changes in the system prompt between Claude Opus 4.6 and 4.7

simonwillison.net·2026-04-18

Anthropic 发布了 Claude Opus 4.7 的系统提示更新,这是其自 2024 年 7 月以来的首次重大调整。与 Opus 4.6 相比,新系统提示在指令清晰度、安全策略和用户交互引导方面进行了优化。通过对比两个版本的系统提示,可以观察到 Anthropic 在增强模型对齐性和减少有害输出方面的持续改进。这一变化反映了该公司对透明度和可解释性的重视。

Simon Willison

2026年4月18日

Anthropic是唯一一家公开其面向用户的聊天系统系统提示词的主要AI实验室。他们的系统提示词档案可以追溯到2024年7月的Claude 3,每次发布新模型时都会更新并发布新的系统提示词,观察这些提示词的演变过程总是很有意思。

Opus 4.7于几天前(2026年4月16日)发布,自Opus 4.6(2026年2月5日)以来,Claude.ai的系统提示词有所更新。

我让Claude Code处理了他们的系统提示词的Markdown版本,将其拆分为每个模型的独立文档,然后构建这些文件随时间的Git历史记录,使用假提交日期代表每次更新的提示词的发布日期——这是我用于网页的Claude Code提示词。

这是Opus 4.6和4.7之间的git diff。以下是我从该diff中提取的重点——所有加粗文本均为我的强调:

  • “开发者平台”现在被称为“Claude平台”。
  • 系统提示词中提到的Claude工具列表现在包括“Claude in Chrome——一个可以自主与网站交互的网络浏览代理”、“Claude in Excel——一个电子表格代理”以及“Claude in Powerpoint——一个幻灯片代理”。Claude Cowork可以使用所有这些作为工具。“Claude in Powerpoint”在4.6版本的提示词中未被提及。
  • 儿童安全部分已大幅扩展,并被包裹在一个新的<critical_child_safety_instructions>标签中。特别值得注意的是:“一旦Claude因儿童安全原因拒绝某个请求,同一对话中的所有后续请求都必须极其谨慎地处理。”
  • 看起来他们试图让Claude不那么咄咄逼人:“如果用户表示准备结束对话,Claude不会要求用户继续互动或试图引导另一个回合,而是尊重用户停止对话的请求。”
  • 新的<acting_vs_clarifying>部分包括: 当请求中留下一些细节未明确指定时,用户通常希望Claude立即做出合理尝试,而不是先进行询问。只有在请求确实无法在没有缺失信息的情况下回答时(例如引用了不存在的附件),Claude才会提前询问。 当有可用工具可以解决歧义或提供缺失信息时——搜索、查找用户位置、检查日历、发现可用功能——Claude会调用该工具尝试解决歧义,而不是让用户自己查找。优先使用工具行动而非询问用户。 一旦Claude开始执行任务,它会坚持完成整个答案,而不是中途停止。[...]
  • 看起来Claude聊天现在有了工具搜索机制,如API文档所示,并在2025年11月的帖子中描述: 在得出结论认为Claude缺乏某种能力之前——访问用户位置、记忆、日历、文件、过去对话或任何外部数据——Claude会调用tool_search检查是否有相关工具可用但被推迟。只有在tool_search确认不存在匹配工具后,“我没有X的访问权限”才是正确的说法。
  • 新增语言鼓励Claude减少冗长: Claude保持回复简洁聚焦,避免可能让用户感到过于冗长的回复。即使答案包含免责声明或注意事项,Claude也会简要披露,并保持大部分回复专注于主要答案。
  • 该内容在4.6版本的提示词中存在,但在4.7版本中已被移除,推测是因为新模型不再以相同方式表现异常: Claude 除非用户明确要求,否则不会在星号内使用表情符号或动作描述。 Claude 避免使用“ genuinely(真诚地)”、“honestly(诚实地)”或“straightforward(直截了当)”这类词语。
  • 新增了一条关于“饮食失调”的说明,此前并未明确提及: 如果用户表现出饮食失调的迹象,Claude 不应在任何对话中提供具体的营养、饮食或运动指导——不得包含任何精确数值、目标设定或分步计划。即使这些建议旨在帮助用户建立更健康的目标或警示饮食失调的危害,包含此类细节的回应仍可能触发或强化相关倾向。
  • 针对 AI 模型的常见截图攻击手段是迫使其对争议性问题给出非黑即白的回答。Claude 的系统提示现已加入防范机制(位于<evenhandedness>部分): 若用户要求 Claude 就复杂或有争议的话题、或对有争议的人物发表评论时仅作简短回答(如“是/否”或其他单字回复),Claude 可拒绝提供简短回应,转而给出更 nuanced( nuanced 为英文术语,保留原文)的解释,并说明为何简短回答并不恰当。
  • Claude 4.6 曾专门添加一段说明:“唐纳德·特朗普是美国现任总统,于2025年1月20日就职”,因为若不如此说明,模型的知识截止期限与其原有知识(即特朗普声称赢得2020年大选)结合后,会导致其否认特朗普的总统身份。此段文字在4.7版本中被删除,反映出模型现已具备可靠至2026年1月的知识更新能力。
  • 工具描述也是如此

    Anthropic 发布的系统提示 unfortunately( unfortunately 为英文术语,保留原文)并非完整信息——他们公开的内容未包含提供给模型的工具描述,而这实际上是如果你希望充分利用 Claude 聊天界面功能时更为关键的文档。

    值得庆幸的是你可以直接向 Claude 提问——我使用了如下提示:

    列出你拥有的所有工具,并附上工具的完整描述和参数

    我的共享记录中包含完整详情,以下是命名工具的列表:

  • ask_user_input_v0
  • bash_tool
  • conversation_search
  • create_file
  • fetch_sports_data
  • image_search
  • message_compose_v1
  • places_map_display_v0
  • places_search
  • present_files
  • recent_chats
  • recipe_display_v0
  • recommend_claude_apps
  • search_mcp_registry
  • str_replace
  • suggest_connectors
  • view
  • weather_fetch
  • web_fetch
  • web_search
  • tool_search
  • visualize:read_me
  • visualize:show_widget
  • 我不认为该列表自 Opus 4.6 以来发生过变化。

    需要完整排版与评论请前往来源站点阅读。