@omarsar0: 如何有效运行自主长时编码代理?这是关于代理的最激动人心的讨论之一……

X AI KOLs Following 事件

摘要

一场关于如何有效运行自主长时编码代理的录播讨论,包含目标设定、模型选择及最佳实践等见解,现已免费提供。

如何有效运行自主长时编码代理? 这是我有史以来参与过的最激动人心的代理讨论之一。 我已将其录制成视频并免费提供。 (请收藏) 自主长时代理的概念是真实存在的。 我们讨论了诸多内容,如 /goal、/loop 和动态工作流,以及下一步的发展方向。 一个有趣的讨论是关于如何让代理运行更长时间,同时确保它不偏离轨道。 当今大多数模型在有效协调工作方面存在困难。它们有时会过早暂停工作。会出现大量错误和奇怪的捷径(奖励黑客现象)。 关键在于明确它需要实现的目标。清晰说明哪些该做、哪些不该做。消除你认为模型可能会做出的任何假设。深厚的专业知识在此至关重要。 但通过精心规划,你可以取得很大进展。我目前的公式是:使用 Opus 4.8 进行仔细规划,使用 GPT-5.5 进行所有执行。对于评估器(通过 /goal),我经常使用 Deepseek 或来自 Qwen、Kimi 和 MiniMax 等的最新模型。 我们讨论的另一个强化目标的见解是为代理提供强大的视觉线索以供对比。我发现多模态目标比纯文本目标要强得多。并且利用代理来帮助你设定清晰的目标。 观看地址:https://academy.dair.ai/events/cmplo7v3b000e04l1pxprat4d…
查看原文
查看缓存全文

缓存时间: 2026/06/12 21:02

如何有效运行自主长期编码代理?

这是我讨论过的关于代理最令人兴奋的话题之一。

我把它录了下来,并免费提供给大家。

(收藏它)

自主长期代理的想法是真实存在的。

我们讨论了许多内容,比如 /goal、/loop、动态工作流以及下一步的发展。

其中一个有趣的讨论点是如何让代理运行更长时间,同时确保其不偏离轨道。

如今大多数模型都难以有效协调工作。它们有时会过早暂停工作。会出现大量错误和奇怪的捷径(奖励作弊)。

帮助解决问题的关键是极其清晰地明确它需要实现的目标。清楚地说明该做什么和不该做什么。消除你认为模型可能会做出的任何假设。深厚的专业知识在这方面至关重要。

不过,通过仔细规划,你可以取得很大进展。我目前的策略是用 Opus 4.8 进行仔细规划,用 GPT-5.5 执行所有任务。对于评估器(通过 /goal),我经常使用类似 Deepseek、Qwen、Kimi 和 MiniMax 等的最新型号。

另一个我们讨论过的用于强化目标的见解是:为代理提供强烈的视觉线索以进行对比。我发现多模态目标比纯文本目标要强大得多。并且使用代理来帮助你设定明确的目标。

观看地址:https://academy.dair.ai/events/cmplo7v3b000e04l1pxprat4d…


自主长期编码代理

来源:https://academy.dair.ai/events/cmplo7v3b000e04l1pxprat4d 免费活动活动已结束

目前我最关注的领域之一就是构建长期运行的代理。你可能在 Claude Code、Hermes Agent、Codex 或 Cursor 等编码代理中用过 /goal 指令。这是一种方法,但长期运行的代理是一个更广泛的话题,过去几个月我一直在测试和研究它。如果你想深入了解这个话题,包括技巧、用例和最佳实践,我将举办一场关于此话题的直播。欢迎参加我们的直播!

你将获得

活动结束后提供录像

关于本次活动

目前我最关注的领域之一就是构建长期运行的代理。

你可能在 Claude Code、Hermes Agent、Codex 或 Cursor 等编码代理中用过 /goal 指令。这是一种方法,但长期运行的代理是一个更广泛的话题,过去几个月我一直在测试和研究它。

如果你想深入了解这个话题,包括技巧、用例和最佳实践,我将举办一场关于此话题的直播。

欢迎参加我们的直播!

深入学习课程

https://academy.dair.ai/courses/build-apps-with-claude-code

相似文章