将本地代理转变为自我优化代理

Reddit r/LocalLLaMA 2026/05/26 17:51 工具

摘要

一个自我优化的智能体管线，在TerminalBench上将基准性能从约30%提升至约90%，并且可以通过记录交互、使用本地模型进行反思、以及将经验注入未来的系统提示中，扩展应用到日常对话场景。

我在试验一个自我优化的代理管道，用来冲击基准排行榜（TerminalBench）。在 10 个任务的子集上，性能从约 30% 提升到了约 90%。这个循环奏效了，于是我问自己：同样的反思-重写步骤能否持续应用于日常聊天，而不是只针对基准测试？ **工作原理** * 每次与本地 LLM 的聊天都会经过一个小型代理并被记录下来。 * `autoswarm reflect` 让同一个本地模型审查这些日志，提炼出具体的教训，并将其写入 `skills.yaml`。 * 这些教训会自动注入到未来聊天的系统提示中。 **运行方式（LM Studio 路径）** 1. 启动 LM Studio 的本地服务器，并加载一个模型。 2. ```bash pip install -e . autoswarm doctor # 验证 LM Studio 是否可达 autoswarm start # 自动检测上游和模型，监听在 :8080 ``` 我对自我优化代理的想法非常着迷，并且相信这背后有**更大的东西值得挖掘**。不过，这只是一个业余项目，我仍在试验中。欢迎反馈！链接：[https://github.com/arteemg/autoswarm](https://github.com/arteemg/autoswarm) 我目前在积极开发这个项目，请 [**⭐ 收藏该仓库**](https://github.com/arteemg/autoswarm/) 以获取最新更新。

查看原文

将本地代理转变为自我优化代理

相似文章

一种基于观测上下文压缩的高效终端智能体自我演化框架

Terminal-World: 通过智能体技能扩展终端代理环境

@IntuitMachine: https://x.com/IntuitMachine/status/2078419526354378975

智能体优化器能否实现累积提升？——基于 Terminal-Bench 2.0 的持续学习评估

@omarsar0: 关于自我改进代理的非常好的建议。（收藏）这是我正在自己的实验中观察到的现象，关于编码...

提交意见反馈