@rohanpaul_ai: AI代理可以在不重新训练代理本身的情况下,通过使用一个独立的小模型来清理并...

X AI KOLs Following 论文

摘要

AdaCoM是一个独立的大语言模型,用于管理冻结AI代理的上下文,在不重新训练的情况下提升长任务性能。在测试中,它使平均网络搜索性能提高了39%。

AI代理可以在不重新训练代理本身的情况下,通过使用一个独立的小模型来清理和组织其上下文,从而更好地完成长任务。 它将上下文管理移出代理,由独立的辅助程序清理任务历史,而主代理保持不变。 论文提出AdaCoM,这是一个独立的大语言模型,在代理执行下一步之前编辑其工作上下文。 AdaCoM在任务历史和冻结代理之间放置一个独立的、经过训练的管理器,这样代理无需学习新的记忆习惯或暴露其权重。 在每一步之前,该管理器可以重写、合并、剪枝或保留运行上下文的某些部分,然后原始代理基于清理后的版本执行操作。 这听起来像是摘要,但区别至关重要。 摘要假设正确答案是压缩,而AdaCoM学会不同代理需要不同类型的上下文来保持胜任能力,因为更强的代理可以使用更多原始历史,而较弱的代理则需要更短、更清晰的笔记。 他们在多个代理上测试了AdaCoM的网络搜索和深度研究任务,结果显示平均网络搜索性能提高了39%。 ---- 链接 – arxiv. org/abs/2605.30785 标题:“学习面向长视界任务的代理兼容上下文管理”
查看原文
查看缓存全文

缓存时间: 2026/06/09 10:46

AI agent 可以在不重新训练自身的情况下,通过使用一个独立的小模型来清理和组织其上下文,从而更好地处理长程任务。

将上下文管理移出agent,这样独立的辅助模型可以在主agent保持不变的同时,清理任务历史记录。

该论文提出了 AdaCoM,这是一个独立的 LLM,在 agent 执行下一步操作之前,负责编辑 agent 的工作上下文。

AdaCoM 在任务历史与冻结的 agent 之间放置了一个独立的、经过训练的“管理器”,因此 agent 无需学习新的记忆习惯或暴露其权重。

在每一步之前,这个管理器可以重写、合并、修剪或保留运行上下文中的部分内容,然后原始 agent 基于清理后的版本采取行动。

这听起来像是总结,但区别很重要。

总结的前提是正确答案在于压缩,而 AdaCoM 则通过学习认识到,不同的 agent 需要不同类型的上下文才能保持胜任——更强的 agent 可以使用更多的原始历史记录,而较弱的 agent 则需要更短、更清晰的笔记。

他们在多个 agent 上对 AdaCoM 进行了网页搜索和深度研究任务的测试,结果显示平均网页搜索性能提升了 39%。


链接 – arxiv.org/abs/2605.30785

标题:“Learning Agent-Compatible Context Management for Long-Horizon Tasks”

相似文章

面向长周期任务的智能体兼容上下文管理

arXiv cs.AI

介绍AdaCoM,一种基于外部LLM的上下文管理器,适用于冻结的智能体。通过保留任务约束和修剪过时内容,利用强化学习提升长周期任务性能,并在网络搜索和深度研究基准上进行了实验。