FORT-Searcher: 合成抗捷径搜索任务用于训练深度搜索智能体

Hugging Face Daily Papers 论文

摘要

FORT-Searcher 提出了一种框架,通过识别和缓解四种捷径风险,为深度搜索智能体合成抗捷径的训练数据。由此产生的智能体经过监督微调训练,在可比较的开源搜索智能体中取得了最先进的性能。

训练深度搜索智能体需要可验证的问题,这些问题的答案在通过搜索获取足够证据之前是不可用的。现有的合成方法通常通过丰富图结构来增加表面难度,但单纯的复杂性并不能保证实际的搜索难度:预期的搜索过程可能通过一条更便宜的识别路径而崩溃。我们通过一个感知捷径的难度框架形式化了这一差距,并识别出四种可操作的捷径风险:证据共覆盖、单线索选择性、暴露常量和先验知识绑定。为了诊断它们的实际效果,我们使用轨迹特征,包括求解成本、答案命中时间和先验捷径率。在此框架指导下,我们引入了FORT,一个抗捷径训练数据合成框架。FORT通过控制实体选择、证据图构建、问题制定和对抗性细化中的捷径风险,构建抗捷径的训练数据。实验表明,与现有的开源深度搜索数据集相比,FORT诱导了更长的答案前搜索和更少的捷径模式。利用由此产生的轨迹,我们仅使用监督微调(SFT)训练了FORT-Searcher,并在具有挑战性的深度搜索基准测试中,在相当规模的开源搜索智能体中取得了最佳整体性能。相关资源将在https://github.com/RUCAIBox/FORT-Searcher 提供。
查看原文
查看缓存全文

缓存时间: 2026/06/12 02:52

论文页面 - FORT-Searcher: 合成抗捷径的搜索任务以训练深度搜索代理

来源:https://huggingface.co/papers/2606.12087
发布于 6 月 10 日

#2 每日论文 (https://huggingface.co/papers/date/2026-06-12)

作者:

,

,

,

,

,

,

,

,

,

,

摘要

一个用于为深度搜索代理创建抗捷径训练数据的框架,通过识别并缓解数据合成过程中的四种捷径风险。

训练深度搜索代理 (https://huggingface.co/papers?q=deep%20search%20agents) 需要可验证的问题,且答案在通过搜索获取足够证据之前不可得。现有合成方法通常通过丰富图结构来增加表观难度,但仅凭结构复杂性并不能保证实际的搜索难度:本应多步的搜索过程可能通过更廉价的识别路径而崩溃。我们通过捷径感知难度框架 (https://huggingface.co/papers?q=shortcut-aware%20difficulty%20framework) 形式化了这一差距,并识别了四种可操作的捷径风险 (https://huggingface.co/papers?q=shortcut%20risks):证据共覆盖、单线索选择性、暴露常量以及先验知识绑定。为了诊断它们的实际影响,我们使用了轨迹特征 (https://huggingface.co/papers?q=trajectory%20signatures),包括解决成本、答案命中时间以及先验捷径率。在此框架指导下,我们提出了 FORT (https://huggingface.co/papers?q=FORT),一个抗捷径训练数据合成框架。FORT (https://huggingface.co/papers?q=FORT) 通过在实体选择、证据图构建、问题制定和对抗性改进中控制捷径风险 (https://huggingface.co/papers?q=shortcut%20risks) 来构建抗捷径的训练数据。实验表明,与现有的开源深度搜索数据集相比,FORT (https://huggingface.co/papers?q=FORT) 诱导了更长的答案前搜索和更少的捷径模式。利用生成的轨迹,我们仅通过监督微调 (https://huggingface.co/papers?q=supervised%20fine-tuning) (SFT) 训练了 FORT (https://huggingface.co/papers?q=FORT)-Searcher,并在具有挑战性的深度搜索基准 (https://huggingface.co/papers?q=deep%20search%20benchmarks) 上取得了可比较规模开源搜索代理中的最佳整体性能。相关资源将在 https://github.com/RUCAIBox/FORT (https://huggingface.co/papers?q=FORT)-Searcher 提供。

查看 arXiv 页面 (https://arxiv.org/abs/2606.12087)查看 PDF (https://arxiv.org/pdf/2606.12087)GitHub4 (https://github.com/RUCAIBox/FORT-Searcher)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.12087)

在您的代理中获取此论文:

hf papers read 2606\.12087

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

无模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2606.12087 以从本页链接。

引用此论文的数据集0

无数据集链接此论文

在数据集 README.md 中引用 arxiv.org/abs/2606.12087 以从本页链接。

引用此论文的 Space0

无 Space 链接此论文

在 Space README.md 中引用 arxiv.org/abs/2606.12087 以从本页链接。

包含此论文的收藏集0

无收藏集包含此论文

将此论文添加到收藏集 (https://huggingface.co/new-collection) 以从本页链接。

相似文章