FastContext:训练高效的编码代理仓库探索器
摘要
FastContext引入了专门的探索模型,将LLM代理中的仓库探索与代码求解分离,将Token消耗降低多达60%,同时提升软件工程基准上的解决率。
查看缓存全文
缓存时间: 2026/06/16 02:59
论文页面 - FastContext:为编码智能体训练高效仓库探索器
来源:https://huggingface.co/papers/2606.14066
摘要
FastContext 在 LLM 智能体中通过使用专门的探索模型将仓库探索与代码求解分离,从而降低令牌消耗、提升解决率。
大型语言模型 (Large Language Model)(https://huggingface.co/papers?q=Large%20Language%20Model)(LLM) 编码智能体 (coding agents)(https://huggingface.co/papers?q=coding%20agents)已在软件工程任务中取得强劲成果,然而仓库探索 (repository exploration)(https://huggingface.co/papers?q=repository%20exploration)仍是主要瓶颈:定位相关代码会消耗大量令牌预算,并用无关片段污染智能体的上下文。在大多数智能体中,同一模型既负责探索仓库又负责求解任务,将探索性读取和搜索留在求解器的历史记录中。我们提出 FastContext,一种专门的探索子智能体 (exploration subagent)(https://huggingface.co/papers?q=exploration%20subagent),它将仓库探索 (repository exploration)(https://huggingface.co/papers?q=repository%20exploration)与求解分开。FastContext 按需调用,发出并行工具调用 (tool calls)(https://huggingface.co/papers?q=tool%20calls),并返回简洁的文件路径和行范围作为聚焦上下文。FastContext 由专门的探索模型 (specialized exploration models)(https://huggingface.co/papers?q=specialized%20exploration%20models)驱动,参数规模从 4B 到 30B。我们从强参考模型轨迹 (reference-model trajectories)(https://huggingface.co/papers?q=reference-model%20trajectories)中引导出这些模型,并使用面向任务的奖励 (task-grounded rewards)(https://huggingface.co/papers?q=task-grounded%20rewards)对其进行细化,以实现宽泛的首轮搜索 (first-turn search)(https://huggingface.co/papers?q=first-turn%20search)、多轮证据收集 (multi-turn evidence gathering)(https://huggingface.co/papers?q=multi-turn%20evidence%20gathering)和精确引用生成 (precise citation generation)(https://huggingface.co/papers?q=precise%20citation%20generation)。在 SWE-bench Multilingual (SWE-bench Multilingual)(https://huggingface.co/papers?q=SWE-bench%20Multilingual)、SWE-bench Pro (SWE-bench Pro)(https://huggingface.co/papers?q=SWE-bench%20Pro)和 SWE-QA (SWE-QA)(https://huggingface.co/papers?q=SWE-QA)上,将 FastContext 集成到 Mini-SWE-Agent (Mini-SWE-Agent)(https://huggingface.co/papers?q=Mini-SWE-Agent)中,端到端解决率最高可提升 5.5%,同时编码智能体的令牌消耗最多降低 60%,且额外开销极小。这些结果表明,仓库探索 (repository exploration)(https://huggingface.co/papers?q=repository%20exploration)可以与求解分离,并由专门模型有效处理。代码和数据:https://github.com/microsoft/fastcontext
查看 arXiv 页面 (https://arxiv.org/abs/2606.14066) 查看 PDF (https://arxiv.org/pdf/2606.14066) 项目页面 (https://huggingface.co/microsoft/FastContext-1.0-4B-SFT) GitHub (https://github.com/microsoft/fastcontext) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.14066)
在您的智能体中获取此论文:
hf papers read 2606.14066
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
无模型链接此论文
请在模型 README.md 中引用 arxiv.org/abs/2606.14066 以从此页面链接。
引用此论文的数据集0
无数据集链接此论文
请在数据集 README.md 中引用 arxiv.org/abs/2606.14066 以从此页面链接。
引用此论文的 Space0
无 Space 链接此论文
请在 Space README.md 中引用 arxiv.org/abs/2606.14066 以从此页面链接。
包含此论文的收藏0
无收藏包含此论文
请将此论文添加到收藏 (https://huggingface.co/new-collection) 以从此页面链接。
相似文章
microsoft/FastContext-1.0-4B-SFT
微软发布了 FastContext-1.0,这是一个轻量级的仓库探索子代理,用于LLM编码代理,可将主代理的token消耗降低高达60%,同时将解决率提高高达5.5%。
SWE-Explore:编码代理仓库探索能力基准测试
SWE-Explore 引入了一个基准测试,用于评估编码代理的仓库探索能力,要求在行预算内返回相关代码区域的排序列表。实验表明,基于代理的探索优于传统检索,而行级覆盖仍然是关键区分因素。
更少上下文,更智能代理:面向长周期工具使用的LLM代理的高效上下文工程
本文评估了企业工具使用工作流中LLM代理的上下文工程配置,表明选择性修剪的摘要化相比全上下文基线实现了91.6%的准确率,同时将令牌使用量减少了60%以上。
LLM智能体能够查看代码仓库
本文首次系统性地实证研究了使用可视化仓库表示来增强基于LLM的编码智能体,结果表明,将可视化图作为补充模态集成,可以在保持或提高问题解决准确率的同时,将令牌消耗降低高达26%。
我为代码智能体构建了一个上下文窗口优化框架——开源 + 论文
作者介绍了“Apohara Context Forge”,这是一个开源框架及方法论,旨在通过角色感知分割和分层相关性评分来优化代码智能体的上下文窗口。