Claude Code 的“扩展思考”只是摘要,并非真正的思考
摘要
该文章揭示 Claude Code 的“扩展思考”输出并非实际推理过程,而仅是摘要;完整推理内容已被加密,本地无法访问,需企业级协议才能获取,这引发了关于透明度和审计追踪的担忧。
暂无内容
查看缓存全文
缓存时间: 2026/06/22 16:34
# Claude Code“扩展思考”输出的内容并不真实。——博客
来源:https://patrickmccanna.net/the-text-in-claude-codes-extended-thinking-output-is-not-authentic/
Claude Code 会将每次会话记录到磁盘上。这些日志包含“思考块”(thinking blocks)——模型在工作时的自身推理过程。
这个周末我打算检查一下这些推理内容,却发现了一个 600 字符长的`签名`(signature),而没有任何文本。
于是我去读了文档:https://platform.claude.com/docs/en/build-with-claude/extended-thinking
一些需要注意的细节:
- Claude 将其推理内容加密到那个签名中。
- Anthropic 持有密钥。你的机器无法获取该密钥。
- API 返回的是推理内容的摘要,而非推理本身。
- 获取完整的思考输出需要签订企业协议。
Matt Green 对此进行了研究,并对签名块有更详细的观察。(https://blog.cryptographyengineering.com/2026/05/29/fooling-around-with-encrypted-reasoning-blobs/)
在你向任何人承诺可以提供审计轨迹之前,这一点值得了解。另外——请注意:通过 ctrl+o 获得的“扩展思考”输出只是 Fable/Opus 思考过程的摘要。(https://platform.claude.com/docs/en/build-with-claude/extended-thinking#summarized-thinking)它并不是驱动模型在会话中采取行动的实际思考过程,而是思考逻辑的摘要。这就像把一个 JPEG 保存为 BMP 文件,然后编辑这个 BMP 文件,再把它当作 JPEG 展示出来。转换过程会造成数据丢失。
我对 Anthropic 呈现其应用程序行为的方式感到失望。如果你曾经需要一个记录,来追踪“你的代理”在会话期间使用的逻辑:
- 你无法通过本地文件生成这样的记录。系统上的推理日志你无法访问。
- 你可以通过一些粗糙的爬取手段记录运行中的 Claude Code 的输入、输出和操作——但即便如此,那也不是驱动代理行为背后的实际推理。
而且文档中的措辞也极其委婉。如果你没喝咖啡,很可能会漏掉“扩展思考返回的是 Claude 完整思考过程的摘要”这一句。
截图
开源模型的性能改进需要加快步伐。
相似文章
"think" 工具:让 Claude 在复杂工具使用场景中停下来思考
Anthropic 推出了 "think" 工具,这是一种让 Claude 在复杂工具调用链中暂停并进行推理的特定机制,与其通用的扩展思考能力有所区别。
探究加密推理块
作者探究了来自OpenAI和Anthropic的LLM API中的加密推理块,讨论了链式思考数据如何被加密和签名,以及篡改这些块的安全影响。
LLM推理研究中的奇怪现象:我们正在尝试去除思维链痕迹
本文讨论了LLM推理研究的一个转变:从通过思维链使推理显式化,转向探索无需语言痕迹的潜在推理,质疑可见性对于有效推理是否必要。
Claude Code 与 Codex 对比
用户希望比较 Claude Code 和 OpenAI Codex $20 订阅方案的价值,并分享了自己涉及 Haiku、Sonnet、Qwen 和 DeepSeek 的个人工作流。
Claude Code 在大型代码库中的工作原理
Anthropic 的博文详细介绍了在大型复杂代码库中使用 Claude Code 的最佳实践,阐述了代理搜索以及如 CLAUDE.md 文件等扩展的“利用”如何在大规模下提升导航和性能。