标签
TreeSeeker 是一个推理时框架,将深度搜索组织为对树结构状态的分支与回溯,利用文本 UCB 信号来平衡利用、探索与剪枝。它在深度搜索基准测试上优于强基线,表明显式的分支与回溯控制能改善多步网页搜索。