TIDE: 通过模板引导迭代的主动多问题发现
摘要
TIDE 是一个模板引导的迭代框架,用于从上下文中发现多个隐藏问题,提升文档和代码环境中的问题识别与解决能力。它利用迭代发现和思维模板,超越了单次和多智能体基线方法。
查看缓存全文
缓存时间: 2026/06/05 06:06
论文页面 - TIDE: 通过模板引导迭代实现主动多问题发现
来源:https://huggingface.co/papers/2606.04743
摘要
TIDE 是一个模板引导的迭代框架,用于从上下文中发现隐藏问题,通过迭代发现和思维模板来改进文档与代码环境中的问题识别与解决。
智能体被广泛部署为用于文档、工具和代码的助手。然而,它们通常仅对用户的显式请求做出响应,而这些请求只反映了用户已注意到的问题,但在更广泛的用户上下文中,还有许多其他重要问题共存且“明摆在眼前”却被忽视,其总数事先未知。我们将此定义为从上下文中发现多个隐藏问题的任务:需要揭示共存的问题,为每个问题提供可支撑的证据,并配以具体行动。为此,我们提出 TIDE,一个模板引导的迭代框架,包含两种互补机制。具体而言,受单次预测往往锚定最显著案例并产生泛泛论断这一观察启发,我们提出了迭代发现 (https://huggingface.co/papers?q=iterative%20discovery),它在每轮中输出一小批候选问题,同时根据已发现的内容进行条件约束,从而后续轮次扩展覆盖范围;以及思维模板 (https://huggingface.co/papers?q=thought%20templates),这是从先前已解决案例中提炼出的可复用模式,指明了要注意哪些上下文信号以及如何将它们联系起来,从而将每个预测锚定在一个可识别的问题类别上。我们在两个现实场景(个人工作空间和软件仓库)上,使用四个模型骨干验证了 TIDE,结果显示在任务覆盖率 (https://huggingface.co/papers?q=task%20coverage)、识别率 (https://huggingface.co/papers?q=identification) 和解决率 (https://huggingface.co/papers?q=resolution) 上,TIDE 相比单次和并行多智能体基线有显著提升。
查看 arXiv 页面 (https://arxiv.org/abs/2606.04743)查看 PDF (https://arxiv.org/pdf/2606.04743)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.04743)
在你的智能体中获取这篇论文:
hf papers read 2606\.04743
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用该论文的模型0
暂无模型引用该论文
在模型 README.md 中引用 arxiv.org/abs/2606.04743 即可从此页面链接。
引用该论文的数据集0
暂无数据集引用该论文
在数据集 README.md 中引用 arxiv.org/abs/2606.04743 即可从此页面链接。
引用该论文的 Spaces0
暂无 Space 引用该论文
在 Space README.md 中引用 arxiv.org/abs/2606.04743 即可从此页面链接。
包含该论文的收藏集0
暂无收藏集包含该论文
将此论文添加到一个收藏集 (https://huggingface.co/new-collection) 即可从此页面链接。
相似文章
基于 TIDE 的稳健议论文理解:一种融合试炼与辩论的交互框架
本文介绍了 TIDE,一种新颖的框架,它整合了试炼与辩论机制,以改善基于标准的提示优化,用于议论文理解任务,如自动作文评分、论证成分检测和论证关系识别。实验结果显示性能提升,突显了结合基于提示的方法进行鲁棒论证分析的潜力。
TIDE:每一层都知晓上下文中的令牌
本文介绍了 TIDE,一种通过嵌入记忆(Embedding Memory)将令牌身份注入每一层,从而解决大语言模型(LLM)中罕见令牌问题和上下文崩溃问题的方法。作者在理论上和经验上证明了该方法在语言建模和下游任务中的改进。
从I/O到代码的发现智能体
本文介绍了DIO-Agent,这是一种发现智能体,它利用LLM引导的进化搜索和变换优先级前提从输入输出行为中综合生成程序,避免了死胡同。实验表明,在一个新的IO2CodeBench基准测试上,该方法优于传统方法和基线。
My automated doubt development process
A blog post detailing a development process that uses specialized AI subagents to systematically critique and improve specifications before implementation, aiming to rebuild trust in AI-assisted coding through automated doubt and multiple perspectives.
# 先规划,再判断,跑得更好:一个受DMAIC启发的工业异常检测智能体系统
DMAIC-IAD 是一个多智能体大语言模型系统,其设计灵感来源于 DMAIC 质量管理框架,专为工业异常检测而构建。该系统采用"先规划、后判断"的方法,通过标准化操作流程制定检测策略,并利用无需执行的裁判模型对策略进行排序,在四种数据模态上相较于智能体基线实现了 37.76% 的性能提升。