@aniketapanjwani: https://x.com/aniketapanjwani/status/2055314153011581152
摘要
关于如何有效地将GPT Pro集成到编码工作流程中的指南,特别是与Codex配合使用,以避免手动复制粘贴,并利用模型的先进推理能力处理复杂任务。
查看缓存全文
缓存时间: 2026/05/16 03:10
你的 GPT Pro 还没用对
GPT-5 Pro 是目前最强的大语言模型,但你还没把它用到位。
如果你订阅了 ChatGPT 的最高套餐 ChatGPT Pro,你就能使用 Pro 思考模式。
用 OpenAI 自己的话来说,GPT-5 Pro “使用更多计算资源,更深度思考,持续提供更好的答案”。
这些答案有多好?
一位没有正式高等数学背景的 23 岁年轻人,用 GPT Pro 解决了几十年悬而未解的数学难题,通常只靠一次性的提示。
Leeham @Liam06972452 · 4月14日
GPT-5.4 Pro 解决了 Erdős 问题 #1196!
对这个结果非常满意;绝对是我迄今为止最喜欢的!这个问题已经被思考了相当一段时间,这使得这个结果相当令人印象深刻和有意义(参见下面 Lichtman 的评论)。
形式化工作正在进行中!
814 542.4K 864K
Leeham @Liam06972452 · 4月14日
回复 @Liam06972452
给感兴趣的人说一下:5.4 Pro 一次性在80分钟内解决了这个问题,然后又花了大约30分钟把解决方案转换成 LaTeX 数学论文。
191 642 732K
沃顿商学院研究人工智能的经济学教授 Ethan Mollick 表示,如果你在做复杂的学术工作,目前根本没有其他模型可以替代。
Ethan Mollick @emollick · 3月24日
GPT-5.4 Pro 依然是这个级别的唯一模型。对于任何真正困难且复杂的问题,我会把它丢进去,并附上我能想到的所有上下文。结果往往非常有用。
我从 Codex 或 Code 或其他任何模型上都得不到同样的结果。
185 162 2.4K 1.1M
Ethan Mollick @emollick · 3月24日
回复 @emollick
如果你在做复杂的学术工作,目前根本没有其他东西可以替代它。如果 Gemini 3.1 Deep Think 能与之竞争会很好,但它不行,因为它的工具和引用处理得很糟糕,尽管模型本身看起来不错。
111 131 153K
除了学术工作,我本人经常用 Pro 做移动端和 Web 应用开发,以及后端基础设施工程。它能帮我得到更好的结果。
看起来,你总是想要更好的结果,对吧?那你为什么不用 GPT Pro 呢?
GPT Pro 能给你好得多的答案,但代价是花大量时间来给出这些答案。
另外,如果你在 Codex 里工作,翻看模型选择器,你是看不到 GPT Pro 可用的。
这是个很大的问题,因为这样一来,你就很难把你业务、研究和代码的全部上下文提供给这个非常强大的 GPT Pro 模型。
那么,如何最有效地从 Codex 内部使用 GPT Pro 呢?你只能低效地在 Web UI 和 Codex 之间复制粘贴吗?
在这篇文章中,我将解释如何将 GPT Pro 嵌入到你的知识工作中,无论是学术工作、商业或咨询工作,还是软件开发,并且用一种消除 GPT Pro 和 Codex 之间摩擦的方式来实现。
目标很简单:无需手动复制粘贴,同时将代码库和问题的完整上下文提供给 GPT Pro。
想直接看视频/听音频?
我制作了一个与本文对应的 YouTube 视频,其中还包含一个现场演示,一步步教你如何从 Code 内部使用 GPT Pro。
点击此处观看视频:https://youtu.be/R9GUUyB3Utk
如何将 GPT Pro 嵌入你的工作流程
我将 Pro 嵌入工作的方法是这样的:在我先用 Codex 和 Claude Code 的组合对最困难问题进行规划和思考,形成计划后,让 Pro 来审阅这个计划。
为什么这么做?
对于许多类型的软件和研究来说,单独使用 Codex 和 Claude Code 已经足以产生良好或优秀的结果。如果你不需要更强大的 Pro 思考模型,就没必要把它纳入你的流程。
我创建任何重要东西(无论是软件还是研究项目)的常规流程是:首先,使用我自己创建或从他人那里借鉴的一些技能(通常同时使用 Codex 和 Claude Code),通过多个迭代周期来完善计划,直到我对产生的计划感到满意为止。
然后,我通常会把计划交给 Codex 去实现,因为我发现 Codex 在实现和执行方面比 Claude Code 好得多。
然而,有两种情况,我下一步不是去实现,而是让 GPT Pro 审阅这个计划。
第一,如果我对计划的某个方面有重大疑虑,无论是从技术角度、架构角度还是产品角度来看,我会把计划连同我的上下文问题一起交给 GPT Pro 审阅。
第二,即使我没有疑虑,但我觉得这个计划涉及重大的架构、技术或科学复杂性,我也会把计划或文稿交给 GPT Pro 审阅。这包括那些我在做艰难、细微论证的研究或写作项目。
至于什么才算“足够复杂”,这个标准因领域、领域内的项目以及针对特定项目的个人而差异很大。
例如,如果你在数论领域工作,研究那些其他人已经开始用 ChatGPT Pro 解决的问题,那么很可能,无论你是谁,对于你在该领域正在处理的任何问题,你都会想要思考如何最好地构建它,以便让 GPT Pro 模型来攻克。
让我们再考虑两个我有经验的领域,在这些领域中使用 Pro 的决策要模糊得多:经济学研究和咨询工作。
GPT Pro 在经济学研究中的应用
我是一名经济学家,曾与 100 多位经济学家合作过,通过团体和个人会议帮助他们掌握代理式编码工具。
我的网站是 aieconomist.io。我为经济学家举办代理式编码工作坊(https://aieconomist.io/trainings)以及一对一培训(https://aieconomist.io/individual-coaching)。
经济学研究的复杂性在经济学各个领域内外都各不相同。此外,在一个特定项目中,也会有复杂程度不同的任务。
例如,我注意到在与一位产业组织领域(应用微观经济学中公认非常技术性的领域)的著名经济学家合作时,在实现某种我们正在考虑的结构性估计之前,使用 GPT Pro 审阅计划非常有帮助。
GPT Pro 能够提出许多细微差别和反对意见,这位在经济学五大顶级期刊上有数篇发表的教授,在反思后也认为这些意见值得在我们的计划中解决。
我提这个是为了让你——如果你不熟悉 GPT Pro——对 GPT Pro 的思考质量有一个校准。
现在,在应用微观经济学领域中,产业组织被认为是最技术性的。
当与专攻劳动经济学和政治经济学的应用微观经济学家合作时,我们没有发现使用 Pro 有太大优势,因为这些领域通常使用的实证方法,对于现在的编码代理来说,相当简单和程式化。
此外,在所有领域中,Pro 对于实际实现模型的任务,或任何需要交互式数据分析的任务都没有帮助,因为 Pro 没有能力编写代码、查询数据集,然后根据发现进行更新。
最后,即使将 GPT Pro 应用于更复杂的理论领域,如微观经济学或计量经济学理论,也需要技巧和思考,来考虑如何为 GPT Pro 打包一个给定的提示。
通常,仅仅倾倒一堆 PDF 然后向 GPT Pro 提问,是无法得到好答案的。
相反,更好的做法是预先处理你想作为上下文提供给 GPT Pro 的任何输入 PDF,从中提取出与你要解决的问题相关的关键部分。
我举这个例子的目的是:你已有的代理式编码技能和对上下文管理的理解仍然很重要,并且可能对从 GPT Pro 获得好结果起到关键作用。
GPT Pro 在咨询工作中应用
咨询是另一个决定是否使用 GPT Pro 比较模糊的领域。
我自己的咨询工作通常是某种 AI 实施或 AI 教育,但我在寻找适合使用 GPT Pro 的场景时所经历的细微差别,适用于任何类型的咨询。
在我的咨询工作中,我处理许多不同复杂程度的任务。例如,我经常需要撰写提案。
这些提案有时可以相当标准化,但通常需要针对特定客户的需求进行个性化定制,无论是为它们实施某些东西,还是提供某种代理式编码培训。
因此,我制作了一个技能,帮助我思考和自动化提案的个性化定制,并头脑风暴每个客户特有的需求。
我经常做的事情,尤其是对于相当复杂的提案,是在发送提案前请 Pro 审阅,看看它是否能发现任何缺陷。
这通常对于发现提案在结构层面的缺陷非常有帮助。这些缺陷可能是我没有考虑到的,但对于最终的实施很重要,而且较弱的思考模型通常发现不了。
Pro 经常能发现的事情包括:我应该提出的澄清问题,以及我应该向哪些决策者提出这些问题,以便更精确地限定某些交付物的范围。
通常,它还能帮助发现客户的要求(通常基于我与客户的通话记录)与我在提案中提出的内容之间的一些小规模,有时是大规模的不一致之处。
特别是当我们有很多电话会议来限定某个项目范围时,一些小而重要的细节可能会丢失。我发现 Pro 经常能帮助我在提案中找到这些细节。
在教学方面,Pro 可能会给我一些想法,告诉我如何更好地构建课程大纲,以及以什么顺序引入某些主题,考虑到我的学员可能带着什么样的背景进入某个代理式编码课程。它还可以帮助我思考如何创建一门能够服务于不同能力水平的多类受众的单一课程。
当然,Claude Code 和 Codex 也能帮你解决这些问题。我只是觉得 Pro 在发现两者都不会注意到的问题方面特别擅长。
GPT Pro 在软件开发中的应用
除了提案,我从 GPT Pro 获得大量价值的另一个地方是思考架构复杂的软件计划。
对我来说,以及对很多开发者来说,创建软件最耗费脑力的部分是规划你要构建什么。
实际实现,如果有了一个好的计划,是相当容易的。像 Codex 这样的模型现在非常擅长长时间运行的任务,并且能可靠地保持在目标上。
现在,如果你在做一个简单的 CRUD 应用(创建、读取、更新、删除),那么通常你可以凭感觉直接做,甚至不需要提前制定计划。
它可能不完全符合你脑海中的样子,但如果你不关心它是否满足非常精确的要求,而且它又是一个简单的应用,也许你确实不需要计划。
然而,在我看来,即使用上代理式编码工具,制作良好 CRUD 应用的容易程度也有些被夸大了。
在某种程度上,像 Linear 这样的项目管理应用,也可以被简化为一个 CRUD 应用。你创建新任务、更新它们、在 Kanban 板上移动它们,并删除它们。
你可能会想,“这不算什么复杂的软件。我自己就能做。”
然后当你尝试制作这个软件时,你会发现有各种各样的细节边缘,Linear 想出了很多令人难以置信的 UI 选择,以及大量他们投入了大量心血的小便利功能,这些功能服务于真实的项目管理需求。
但是,如果我在制作更复杂的软件,我肯定会把我的计划发给 GPT Pro。
比如,这是我参与过的金融科技产品 PaySlice 的架构。
PaySlice 在三个不同的环境中有六个服务。还有几个外部供应商:Plaid 负责银行业务,Finix 负责支付,Supabase 负责认证。
有两个运营数据库,外加一个独立的分析数据仓库,一个基于 Dagster 的编排层,一个商业智能应用,以及一个操作工具通道。
这一切都必须保持连贯一致。
一个单一的产品变更——比如说调整应用程序显示发薪日就绪状态的方式——可能会在所有环境中影响到这九个组件中的一部分。
这正是那种我在把计划交给 GPT Pro 审阅之前拒绝实施它的系统。
一个好的计划需要尊重的接缝,比我通常能可靠地记在脑海中的东西要大,也比我发现 Codex 或 Claude Code 能自己可靠地浮现出来的东西要大。
什么时候应该使用 GPT Pro?
我们已经介绍了三个相当不同的用例:经济学研究、咨询和软件开发。
但对你来说,在你自己的情况下,这可能包括其中一些用例或其他用例,你如何判断什么时候值得花时间使用 GPT Pro?
我建议,为了找到这个合适的复杂性阈值,你需要亲自试验。
对于你正在考虑听取 Pro 意见的不同问题,将同样的提示发给一次 Pro 和一次 Thinking,看看你得到的结果质量是否有差异。
一开始,你可能想把每一个你会考虑发给 Pro 的问题,都同时发给 Pro 和 Thinking。
然后随着时间的推移,你会对你工作的特定领域产生一种感觉和直觉,知道哪些任务真的需要发给 Pro,哪些任务你只用 Thinking 就可以继续推进。
如何从 Codex 内部使用 GPT Pro
接下来,我们来讨论一下如何真正从 Codex 内部使用 GPT Pro 的实际操作。
正如我提到的,GPT Pro 不会出现在 Codex 的模型选择器中。
你可以通过 API 使用像 OpenCode 这样的编码代理连接到它,你可以按 API 为任何模型付费,但你的账单会很快变得极其昂贵。
所以实际的问题就变成了:如何将所有相关的上下文——你的计划、周围的代码、重要的业务或研究想法以及文档——呈现在 Pro 面前,而无需手动将十几个文件复制粘贴到 ChatGPT 的 Web UI 中?
答案是把这个拆成两个步骤。
第一,打包上下文。让你的编码代理将一个文件组装成一个包,把你仓库中所有相关的上下文取出来,变成一个文件,包括你的提示和你想要问 ChatGPT Pro 的问题。
第二,把这个包发送给 ChatGPT。某个东西(最好是自动化的东西)在浏览器中打开 ChatGPT,放入你创建的包,选择正确的模型,按回车,然后等待 5、10、20 或 30 分钟,不管 GPT Pro 需要多长时间来返回响应。
对于第一步,我使用 Oracle,这是一个由 OpenClaw 的创建者 Pete Steinberger 创建的命令行界面工具。
Oracle 的任务窄而有用。你给它一个提示和一组文件或 glob 模式,它会将它们展开成一个 markdown 文件,尊重 .gitignore,忽略像 node_modules 这样的文件夹,在你为 Pro 创建的包即将超出 Pro 的上下文预算时警告你,然后将其复制到你的剪贴板。
例如,你可以使用这样的一个命令:
实际上,我不会在命令行界面中手动使用 Oracle。
相反,我创建了一个技能,这个技能我已经在我的技能仓库中公开发布了。
你可以在这里下载这个技能:https://github.com/aniketpanjwani/skills/t
相似文章
推出 GPT-5.3-Codex
OpenAI 推出 GPT-5.3-Codex,这是一款先进的智能编程模型,融合了前沿编程能力、推理能力和专业知识,在 SWE-Bench Pro 和 Terminal-Bench 上实现了最先进的性能,同时比前代模型快 25%。
@OpenAI: 就把这个留在这里。 https://chatgpt.com/codex/switch-to-codex/…
OpenAI 发布了一篇迁移指南,指导用户从 ChatGPT 切换到 Codex,这是一款专注于 AI 编程的助手。
Codex 升级功能介绍
OpenAI 发布 GPT-5-Codex,这是 GPT-5 的优化版本,专为代理软件工程任务设计,可通过 API 和 Codex 集成开发环境获取,具有改进的代码审查功能和长形式任务执行能力。
利用 GPT-5.1-Codex-Max 构建更多
OpenAI 推出 GPT-5.1-Codex-Max,这是一款新的智能代理编码模型,具有改进的推理能力、token 效率,以及通过“压缩”机制在数百万个 token 上保持连贯工作的能力。该模型更快速、更智能,可以持续运行数小时甚至数天的长时间任务,代表了 AI 辅助软件工程的重大进步。
GPT-5.2-Codex 介绍
OpenAI 发布了 GPT-5.2-Codex,这是一个先进的代理型编码模型,针对复杂软件工程任务进行了优化,在长上下文理解、Windows 支持和网络安全能力方面有所改进。该模型在 SWE-Bench Pro 和 Terminal-Bench 2.0 上取得了最先进的性能,现已向付费 ChatGPT 用户开放,API 访问将在未来几周内提供。