将本地代理转变为自我优化代理

Reddit r/LocalLLaMA 工具

摘要

一个自我优化的智能体管线,在TerminalBench上将基准性能从约30%提升至约90%,并且可以通过记录交互、使用本地模型进行反思、以及将经验注入未来的系统提示中,扩展应用到日常对话场景。

我在试验一个自我优化的代理管道,用来冲击基准排行榜(TerminalBench)。在 10 个任务的子集上,性能从约 30% 提升到了约 90%。这个循环奏效了,于是我问自己:同样的反思-重写步骤能否持续应用于日常聊天,而不是只针对基准测试? **工作原理** * 每次与本地 LLM 的聊天都会经过一个小型代理并被记录下来。 * `autoswarm reflect` 让同一个本地模型审查这些日志,提炼出具体的教训,并将其写入 `skills.yaml`。 * 这些教训会自动注入到未来聊天的系统提示中。 **运行方式(LM Studio 路径)** 1. 启动 LM Studio 的本地服务器,并加载一个模型。 2. ```bash pip install -e . autoswarm doctor # 验证 LM Studio 是否可达 autoswarm start # 自动检测上游和模型,监听在 :8080 ``` 我对自我优化代理的想法非常着迷,并且相信这背后有**更大的东西值得挖掘**。不过,这只是一个业余项目,我仍在试验中。欢迎反馈! 链接:[https://github.com/arteemg/autoswarm](https://github.com/arteemg/autoswarm) 我目前在积极开发这个项目,请 [**⭐ 收藏该仓库**](https://github.com/arteemg/autoswarm/) 以获取最新更新。
查看原文

相似文章

Terminal-World: 通过智能体技能扩展终端代理环境

arXiv cs.CL

Terminal-World 引入了一个全自动流水线,利用智能体技能为终端代理合成高质量的训练数据,使得模型仅使用 1.2% 的训练数据就能超越基线。该方法从技能原语中共同推导出任务指令、环境和教师轨迹。