@RayFernando1337:在多任务工作流中使用 Cursor 的 Opus 4.8 Max Thinking,在长上下文理解、速度和实现……
摘要
一位开发者分享了他使用 Cursor 的子代理工具与 Opus 4.8 Max Thinking 进行长上下文理解和在 Swift 中实现大型功能的工作流程,强调了动手规划和分阶段验收测试。
查看缓存全文
缓存时间: 2026/06/02 01:53
Opus 4.8 Max Thinking 在 Cursor 中结合多任务工作流,在长上下文理解、速度以及在 Swift 中实现大型功能方面处于顶尖水平。
每个子代理都有自己的上下文窗口,这在处理复杂工作流时非常有帮助。以下是我利用他们首屈一指的子代理框架的一些方式:
- 在规划时,我倾向于让代理启动子代理进行全面的研究。对于我不熟悉的新库,我会这样做,这有助于我学习如何将其集成到我的应用中。我还会告诉代理克隆该仓库,并将其作为未来功能的参考。
1a. 此外,我进行研究任务时最喜欢用的两个工具是 Exa code(它会比内置的 Exa 搜索查看更多来源)和 ref tools MCP。
-
我喜欢让代理生成一个全面的分阶段计划,我会在每个阶段之后进行验收测试,这样我们可以审查集成的结果,并为更改或记录需要在后续阶段处理的错误日志留出空间。(我会在帖子中分享我的 QA 和 Bug 审核技能。)
-
要求代理基于你的计划为工作阶段生成一个交接提示,这样它就会提前告知你正在考虑实现的内容。这样你就可以提出问题或指导代理的工作。这是在与代理一起快速学习的同时不让思维僵化的关键。
-
在手动测试或完成一个阶段的工作后,告诉代理你希望更新计划,以跟踪所需的工作,并帮助你对问题进行范围界定,要么在当前阶段修复,要么将其纳入不同的工作阶段。
我尝试过很多非常放手的工作流,比如 /goal 或 droid 的任务,但我更喜欢坐在驾驶座上,以学习和将我的代理工程标准推向新高度。
归根结底,作为一名工程师,你要对最终进入代码库的内容负责,你会很快感受到你的框架、模型和其他因素的氛围。
Cursor 最新的代理工作流与模型集成得非常好,我迫不及待地想分享在最新版本中将工作流无缝移交给云端是多么容易。
我目前正在启动一个到 UIKit 的大规模重构,之后会报告进展情况。
导致混乱的错误几乎从不会在差异对比中显现出来,只有当你停止审查代码,并像超级用户一样在运行时实际使用它时,你才能真正捕捉到它们,这几乎是你最接近真实客户环境的方式。这就是为什么我能在每个 token 上获得比普通代码审查多得多的价值,我终于开始把我的方法写下来了。
我迫不及待地想让我的代理们飞速运转(BRRRRR)。你最想先看到什么硬件?
相似文章
@RayFernando1337: 导致用户流失的错误几乎从不出现在差异对比中,只有当你停止审查代码时才能真正捕捉到它们……
一位开发者分享了在Cursor中使用Opus 4.8 Max Thinking模型与子代理框架的工作流,并介绍了一个包含可安装技能文件的GitHub仓库,其中包含一个名为'running-bug-review-board'的技能,可进行实时QA测试。
@danshipper: 氛围测试:Opus 4.7 最近感觉进步很大。在编程、写作、策略和深度思考方面都有提升。
用户报告称,Opus 4.7 在编程、写作和策略推理任务上的表现有了显著改善。
@bcherny: 看到多个基准测试显示Opus是长期运行工作中的最佳模型。自主运行Opus的五个技巧……
关于如何让Anthropic的Claude Opus自主运行数小时或数天的实用技巧,例如使用自动模式、动态工作流和自我验证;还提到了用于长期软件任务的SWE-Marathon基准测试。
Claude Opus 4.8 于5月28日发布,其一项特性揭示了AI真正的发展方向。它现在可以将一个任务拆解为数十个并行工作流并同时运行。
Anthropic 发布了具有动态工作流(Dynamic Workflows)功能的 Claude Opus 4.8,支持并行任务执行,并改进了判断能力,可标出不确定性,从而从工具转变为协作者。
@PrajwalTomar_: Rork + Opus 4.7 组合写后端简直离谱,我 5 分钟内就能一次性搞定整个功能——支付、推送、认证全齐活
开发者称 Rork 加上 Opus 4.7 能让他在不到 5 分钟里写完支付、推送、认证等整套后端功能。