TreeSeeker: 树结构深度搜索中的尝试、错误与回溯
摘要
TreeSeeker 是一个推理时框架,将深度搜索组织为对树结构状态的分支与回溯,利用文本 UCB 信号来平衡利用、探索与剪枝。它在深度搜索基准测试上优于强基线,表明显式的分支与回溯控制能改善多步网页搜索。
arXiv:2606.11662v1 公告类型:新
摘要:深度搜索要求智能体通过多步网页搜索、浏览、证据比较与综合来回答复杂问题。一个核心挑战是当多个方向看似合理但只有部分最终能导向可靠证据时,如何决定搜索方向。如果智能体贪婪地跟随当前最佳方向,它可能会持续扩展一个薄弱的延续。如果它不加约束地探索,则可能在孤立的尝试中浪费预算。我们提出 TreeSeeker,一个用于深度搜索中受控尝试与错误的推理时框架。TreeSeeker 将搜索组织为对树结构状态的分支与回溯搜索,其中每个分支是某个子目标的试探方向。在每一轮中,TreeSearch 读取所有子目标树,识别活跃目标,并使用价值、不确定性和风险的文本 UCB 信号,在利用有前景的分支、探索不确定的替代方案或剪枝无成果的延续并回溯到更早的分支点之间做出选择。TreeMem 通过将证据、不确定性、冲突、进展和失败线索附加到产生它们的分支上,来支持这个控制循环,从而使尝试结果能够指导后续决策。在 XBench-DeepSearch、BrowseComp 和 BrowseComp-ZH 上的实验表明,TreeSeeker 持续优于强大的开源基线,表明显式的分支与回溯控制可以补充更强的推理和工具执行能力。
查看缓存全文
缓存时间: 2026/06/11 13:48
# TreeSeeker:深度搜索中的树结构试错与回溯 来源:https://arxiv.org/abs/2606.11662 作者:Zhuofan Shi (https://arxiv.org/search/cs?searchtype=author&query=Shi,+Z), Mingzhe Ma (https://arxiv.org/search/cs?searchtype=author&query=Ma,+M), Lu Wang (https://arxiv.org/search/cs?searchtype=author&query=Wang,+L), Fangkai Yang (https://arxiv.org/search/cs?searchtype=author&query=Yang,+F), Pu Zhao (https://arxiv.org/search/cs?searchtype=author&query=Zhao,+P), Yiming Guan (https://arxiv.org/search/cs?searchtype=author&query=Guan,+Y), Youling Huang (https://arxiv.org/search/cs?searchtype=author&query=Huang,+Y), Wei Zhang (https://arxiv.org/search/cs?searchtype=author&query=Zhang,+W), Qingwei Lin (https://arxiv.org/search/cs?searchtype=author&query=Lin,+Q), Dongmei Zhang (https://arxiv.org/search/cs?searchtype=author&query=Zhang,+D), Saravan Rajmohan (https://arxiv.org/search/cs?searchtype=author&query=Rajmohan,+S) 查看PDF (https://arxiv.org/pdf/2606.11662) > **摘要:** 深度搜索要求智能体通过多步网页搜索、浏览、证据对比与综合来回答复杂问题。一个核心挑战在于:当多个方向看似合理,但只有部分方向能在后续产生可靠证据时,如何决定搜索策略。如果智能体贪婪地跟随当前最优方向,可能会在薄弱方向上不断延伸;如果无节制地探索,又可能将预算浪费在零散的试验上。为此,我们提出 TreeSeeker,一种用于深度搜索中受控试错与回溯的推理时框架。TreeSeeker 将搜索组织为树结构状态上的分支与回溯搜索,其中每个分支对应一个子目标的试探性方向。每一轮,TreeSeeker 读取所有子目标树,识别活跃目标,并利用文本形式的 UCB 信号(价值、不确定性和风险)来决策:是利用一个有前途的分支,探索一个不确定的替代方向,还是剪掉一个无效率的延续并回溯到更早的分支点。TreeMem 支持这一控制循环,它将证据、不确定性、冲突、进展和失败线索附加到产生它们的分支上,从而使试验结果能够指导后续决策。在 XBench-DeepSearch、BrowseComp 和 BrowseComp-ZH 上的实验表明,TreeSeeker 持续优于强开源基线,说明显式的分支与回溯控制可以增强更强的推理与工具执行能力。 ## 提交历史 来自:Mingzhe Ma \[view email (https://arxiv.org/show-email/758d8abd/2606.11662)\] **\[v1\]** 周三, 2026年6月10日 05:10:19 UTC (951 KB)
相似文章
重根Levin树搜索中的结构诱导信息
本文针对Levin树搜索提出了三种重根器设计,利用状态空间结构和学习启发式方法,无需显式子目标生成即可提升搜索效率,实现了当前最优的在线训练效率。
LinTree: 通过显式结构化搜索历史提升LLM推理能力
本文介绍LinTree,通过在线性化搜索历史中添加显式父指针来提升LLM推理能力,表明与隐式推理和启发式引导搜索相比,使树结构显式化能同时提升任务性能和搜索效率。
Arbor:树搜索作为自主代理的认知层
Arbor 引入了结构化树搜索作为自主代理的认知层,通过制衡多代理架构,实现多日、全栈 LLM 推理优化,相比供应商基线,吞吐量-延迟提升高达 193%。
Struct-Searcher:基于主体结构思维推进多模态深度信息获取
Struct-Searcher 引入了一种基于信念修正理论的结构化主体工作流,用于多模态深度信息获取,相较于现有的视觉语言模型和深度研究智能体,实现了显著的准确率提升。
@tom_doerr: 从知识图谱训练深度搜索代理 https://github.com/THUDM/DeepDive
DeepDive 提出了一种自动化方法,利用知识图谱进行数据合成和多轮强化学习,训练深度搜索代理,从而实现复杂的多步推理和网页浏览。