FastContext：训练高效的编码代理仓库探索器

Papers with Code Trending 2026/06/12 00:00 论文

llm coding-agents repository-exploration software-engineering specialized-models fine-tuning token-efficiency

摘要

FastContext引入了专门的探索模型，将LLM代理中的仓库探索与代码求解分离，将Token消耗降低多达60%，同时提升软件工程基准上的解决率。

大型语言模型（LLM）编码代理在软件工程任务上取得了优异成果，但仓库探索仍然是主要瓶颈：定位相关代码会消耗大量Token预算，并用无关片段污染代理的上下文。在大多数代理中，同一模型既探索仓库又求解任务，导致探索性读取和搜索留存在求解器的历史记录中。我们提出了FastContext，一个专用的探索子代理，将仓库探索与求解分离。按需调用时，FastContext会发出并行工具调用，并返回简洁的文件路径和行范围作为聚焦上下文。FastContext由参数规模从4B到30B的专门探索模型驱动。我们通过强参考模型轨迹进行引导，并利用基于任务的奖励进行优化，以实现广泛的首次搜索、多轮证据收集和精确引文生成。在SWE-bench Multilingual、SWE-bench Pro和SWE-QA上，将FastContext集成到Mini-SWE-Agent中，可将端到端解决率提升高达5.5%，同时将编码代理的Token消耗降低多达60%，且开销极小。这些结果表明，仓库探索可以与求解分离，并由专门模型高效处理。代码和数据：https://github.com/microsoft/fastcontext

查看原文

查看缓存全文

缓存时间: 2026/06/16 02:59

论文页面 - FastContext：为编码智能体训练高效仓库探索器

来源：https://huggingface.co/papers/2606.14066

摘要

FastContext 在 LLM 智能体中通过使用专门的探索模型将仓库探索与代码求解分离，从而降低令牌消耗、提升解决率。

大型语言模型 (Large Language Model)（https://huggingface.co/papers?q=Large%20Language%20Model）(LLM) 编码智能体 (coding agents)（https://huggingface.co/papers?q=coding%20agents）已在软件工程任务中取得强劲成果，然而仓库探索 (repository exploration)（https://huggingface.co/papers?q=repository%20exploration）仍是主要瓶颈：定位相关代码会消耗大量令牌预算，并用无关片段污染智能体的上下文。在大多数智能体中，同一模型既负责探索仓库又负责求解任务，将探索性读取和搜索留在求解器的历史记录中。我们提出 FastContext，一种专门的探索子智能体 (exploration subagent)（https://huggingface.co/papers?q=exploration%20subagent），它将仓库探索 (repository exploration)（https://huggingface.co/papers?q=repository%20exploration）与求解分开。FastContext 按需调用，发出并行工具调用 (tool calls)（https://huggingface.co/papers?q=tool%20calls），并返回简洁的文件路径和行范围作为聚焦上下文。FastContext 由专门的探索模型 (specialized exploration models)（https://huggingface.co/papers?q=specialized%20exploration%20models）驱动，参数规模从 4B 到 30B。我们从强参考模型轨迹 (reference-model trajectories)（https://huggingface.co/papers?q=reference-model%20trajectories）中引导出这些模型，并使用面向任务的奖励 (task-grounded rewards)（https://huggingface.co/papers?q=task-grounded%20rewards）对其进行细化，以实现宽泛的首轮搜索 (first-turn search)（https://huggingface.co/papers?q=first-turn%20search）、多轮证据收集 (multi-turn evidence gathering)（https://huggingface.co/papers?q=multi-turn%20evidence%20gathering）和精确引用生成 (precise citation generation)（https://huggingface.co/papers?q=precise%20citation%20generation）。在 SWE-bench Multilingual (SWE-bench Multilingual)（https://huggingface.co/papers?q=SWE-bench%20Multilingual）、SWE-bench Pro (SWE-bench Pro)（https://huggingface.co/papers?q=SWE-bench%20Pro）和 SWE-QA (SWE-QA)（https://huggingface.co/papers?q=SWE-QA）上，将 FastContext 集成到 Mini-SWE-Agent (Mini-SWE-Agent)（https://huggingface.co/papers?q=Mini-SWE-Agent）中，端到端解决率最高可提升 5.5%，同时编码智能体的令牌消耗最多降低 60%，且额外开销极小。这些结果表明，仓库探索 (repository exploration)（https://huggingface.co/papers?q=repository%20exploration）可以与求解分离，并由专门模型有效处理。代码和数据：https://github.com/microsoft/fastcontext

查看 arXiv 页面 (https://arxiv.org/abs/2606.14066) 查看 PDF (https://arxiv.org/pdf/2606.14066) 项目页面 (https://huggingface.co/microsoft/FastContext-1.0-4B-SFT) GitHub (https://github.com/microsoft/fastcontext) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.14066)

在您的智能体中获取此论文：

hf papers read 2606.14066

没有最新的 CLI？curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

无模型链接此论文

请在模型 README.md 中引用 arxiv.org/abs/2606.14066 以从此页面链接。

引用此论文的数据集0

无数据集链接此论文

请在数据集 README.md 中引用 arxiv.org/abs/2606.14066 以从此页面链接。

引用此论文的 Space0

无 Space 链接此论文

请在 Space README.md 中引用 arxiv.org/abs/2606.14066 以从此页面链接。

包含此论文的收藏0

无收藏包含此论文

请将此论文添加到收藏 (https://huggingface.co/new-collection) 以从此页面链接。

FastContext：训练高效的编码代理仓库探索器

论文页面 - FastContext：为编码智能体训练高效仓库探索器

摘要

引用此论文的模型0

引用此论文的数据集0

引用此论文的 Space0

包含此论文的收藏0

相似文章

microsoft/FastContext-1.0-4B-SFT

SWE-Explore：编码代理仓库探索能力基准测试

更少上下文，更智能代理：面向长周期工具使用的LLM代理的高效上下文工程

LLM智能体能够查看代码仓库

我为代码智能体构建了一个上下文窗口优化框架——开源 + 论文

提交意见反馈