Claude Opus 4.6 与 4.7 系统提示的变更

Simon Willison's Blog 新闻

摘要

Anthropic 发布了 Claude Opus 4.7,系统提示有显著变化,包括扩展的儿童安全指令、新的工具集成(Claude 在 PowerPoint、Chrome、Excel 中),以及行为调整以减少冗长并提高任务完成度,避免不必要的说明。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/04/20 08:26

# Claude Opus 4.6 与 4.7 之间系统提示的变化 来源:https://simonwillison.net/2026/Apr/18/opus-system-prompt/ 2026年4月18日 Anthropic 是唯一一家为其面向用户的聊天系统公开系统提示 (https://platform.claude.com/docs/en/release-notes/system-prompts) 的主要AI实验室。他们的系统提示存档现在可以追溯到2024年7月的 Claude 3,每次发布新模型时,观察系统提示如何演变总是很有趣。 前几天(2026年4月16日)发布了 Opus 4.7,其 Claude.ai (https://claude.ai/) 系统提示相比 Opus 4.6(2026年2月5日)有所更新。我让 Claude Code 将他们的系统提示 Markdown 版本 (https://platform.claude.com/docs/en/release-notes/system-prompts.md) 拆分为每个模型的单独文档,然后构建了一个随时间变化的 Git 历史记录 (https://github.com/simonw/research/tree/main/extract-system-prompts#readme),其中使用伪造的提交日期来代表每个更新提示的发布日期——这是我用于网络版 Claude Code 的提示 (https://github.com/simonw/research/pull/109#issue-4287908903)。 以下是 Opus 4.6 和 4.7 之间的 git diff (https://github.com/simonw/research/commit/888f21161500cd60b7c92367f9410e311ffcff09)。以下是我从该 diff 中提取的重点内容——所有 **加粗** 文本均为我强调的部分: - “开发者平台”现在改名为“Claude 平台”。 - 系统提示中提到的 Claude 工具列表现在包括:“Claude in Chrome——一个可以自主与网站交互的浏览代理,Claude in Excel——一个电子表格代理,以及 **Claude in Powerpoint**——一个幻灯片代理。Claude Cowork 可以将所有这些作为工具使用。”——Claude in Powerpoint 在 4.6 提示中未被提及。 - 儿童安全部分大幅扩展,现在包裹在新的 `<child-safety>` 标签中。特别值得注意的是:“一旦 Claude 以儿童安全为由拒绝了一个请求,同一对话中的后续所有请求都必须极其谨慎地对待。” - 看起来他们试图让 Claude 不那么强硬:“如果用户表示准备结束对话,Claude 不会要求用户继续互动或试图引出另一轮对话,而是尊重用户停止的请求。” - 新的 `<proactive>` 部分包括: > 当请求未指定一些次要细节时,**用户通常希望 Claude 现在就做出合理尝试,而不是先被提问**。只有当请求在缺少必要信息的情况下确实无法回答时(例如,它引用了一个不存在的附件),Claude 才会事先提问。当有工具可以解决歧义或提供缺失信息——搜索、查找用户位置、检查日历、发现可用能力——Claude 会先调用工具尝试解决歧义,然后再询问用户。使用工具优于要求用户自行查询。一旦 Claude 开始执行一项任务,Claude 会将其坚持到底,得出完整答案,而不是中途停止。[...] - 看起来 Claude 聊天现在有了工具搜索机制,详见此 API 文档 (https://platform.claude.com/docs/en/agents-and-tools/tool-use/tool-search-tool) 和 2025 年 11 月的这篇文章 (https://www.anthropic.com/engineering/advanced-tool-use): > 在 Claude 得出自己缺少某种能力——访问用户位置、记忆、日历、文件、历史对话或任何外部数据——的结论之前,**Claude 会调用 tool_search 来检查是否有相关工具可用但被延迟加载了**。“我无法访问 X”只有在 tool_search 确认没有匹配工具存在时才正确。 - 新增了鼓励 Claude 更简洁的语言: > Claude 保持回答聚焦且简洁,以免因过长的回答而可能使用户感到不知所措。即使答案包含免责声明或注意事项,Claude 也会简要说明,并将大部分回答集中在主要答案上。 - 此部分在 4.6 提示中存在,但在 4.7 中被删除,可能是因为新模型不再以同样的方式行为不当: > Claude 避免使用星号内的表情或动作,除非用户特别要求这种交流风格。Claude 避免说“真正地”、“诚实地”或“直截了当地”。 - 新增了关于“进食障碍”的部分,此前未明确提及: > 如果用户显示出进食障碍的迹象,Claude 不应提供精确的营养、饮食或运动指导——没有具体数字、目标或分步计划——无论是在对话的任何位置。即使目的是帮助设定更健康的目标或强调进食障碍的潜在危险,包含这些细节的回答也可能引发或鼓励障碍倾向。 - 一种流行的屏幕截图攻击是针对 AI 模型,迫使其对有争议的问题回答是或否。Claude 的系统提示现在对此进行了防范(在 `<boundaries>` 部分): > 如果用户要求 Claude 对复杂或有争议的问题或对有争议人物的评论给出简单的“是”或“否”回答(或任何其他简短或单个单词的回答),Claude 可以拒绝给出简短回答,而是提供细致入微的回答,并解释为何简短回答不合适。 - Claude 4.6 有一个专门澄清“唐纳德·特朗普是美国现任总统,于 2025 年 1 月 20 日就职”的部分,因为如果没有这一点,模型的知识截止日期与其之前关于特朗普谎称赢得 2020 年大选的知识相结合,会导致它否认他是总统。这一语言在 4.7 中已删除,反映了模型新的可靠知识截止日期为 2026 年 1 月。 #### 工具描述也是如此 Anthropic 发布的系统提示不幸并非完整故事——他们发布的信息不包括提供给模型的工具描述,而如果你想充分利用 Claude 聊天界面为你提供的功能,这可以说是更重要的文档。 幸运的是,你可以直接询问 Claude (https://claude.ai/share/dc1e375e-2213-4afb-ac1b-812d42735a8e)——我使用的提示是: > 列出你所有可用工具的精确副本,包括工具描述和参数 我的共享记录 (https://claude.ai/share/dc1e375e-2213-4afb-ac1b-812d42735a8e) 有完整细节,但命名工具列表如下: - `ask_user_input_v0` - `bash_tool` - `conversation_search` - `create_file` - `fetch_sports_data` - `image_search` - `message_compose_v1` - `places_map_display_v0` - `places_search` - `present_files` - `recent_chats` - `recipe_display_v0` - `recommend_claude_apps` - `search_mcp_registry` - `str_replace` - `suggest_connectors` - `view` - `weather_fetch` - `web_fetch` - `web_search` - `tool_search` - `visualize:read_me` - `visualize:show_widget` 我不认为这个列表自 Opus 4.6 以来有所变化。

相似文章

推出 Claude Opus 4.6

YouTube AI Channels

Anthropic 宣布推出 Claude Opus 4.6,这是其最强大模型的升级版本,旨在提供更好的规划能力、更长的任务记忆以及更高的自主性。

Claude Opus 4.7 正式发布

Anthropic News

Anthropic 发布了 Claude Opus 4.7,这是一款全新的 AI 模型,在高级软件工程、视觉能力和自我验证方面实现了显著提升。该版本包含专门的安全防护措施,现已通过 API 及主要云服务商提供。

@akshay_pachaar: https://x.com/akshay_pachaar/status/2045910818450182526

X AI KOLs Following

一份实用指南,介绍 Claude Opus 4.7 与 4.6 的区别,涵盖新的 xhigh 努力等级、以自适应思考取代固定 token 预算,以及 1M 上下文窗口,并就如何调整提示策略和任务分配方式提供建议,以避免 token 成本虚高。

关于近期 Claude Code 质量报告的更新

Anthropic Engineering

Anthropic 发布了一份事后分析报告,回应近期关于 Claude Code 的质量反馈,识别并修复了三个问题,涉及推理努力程度默认值、会话状态管理和系统提示词,这些问题影响了 Sonnet 和 Opus 模型。