从执行结果自举文本到SQL的语义层
摘要
介绍GATE(从执行结果中测试后接地)方法,该方法从执行反馈中自举缺失的语义接地,以处理文本到SQL任务中未明确指定的用户短语,持续提升超越强基线。
arXiv:2606.05634v1 公告类型:新
摘要:现实世界的文本到SQL任务通常需要用户短语在数据库如何存储值的基础上进行接地后才能明确。先前的工作尝试通过要求预先指定语义层来提供接地来解决此问题,但此类规范往往不完整,尤其是在领域特定约定缺乏文档记录的专家领域。由于这为同一SQL部分留下了多个接地假设,我们引入了GATE(从执行结果中测试后接地),该方法从执行反馈中自举缺失的接地。GATE在保持接地假设开放的同时,执行已接地的部分以获得观察结果。然后,仅当假设得到该观察结果支持时,才将其接地并存储为记忆条目,记录测试了什么以及开放部分应如何用SQL编写。这些条目累积形成执行接地记忆,允许后续步骤重用支持的接地。在真实世界和受控基准测试中,GATE持续超越强基线,证明执行不仅可以作为验证手段,还可以作为文本到SQL中可重用记忆的自举机制。
查看缓存全文
缓存时间: 2026/06/05 08:07
# 从执行结果引导语义层用于文本转 SQL 来源:https://arxiv.org/abs/2606.05634 查看 PDF (https://arxiv.org/pdf/2606.05634) > 摘要:现实世界中的文本转 SQL 任务常常存在未明确指定的情况,直到用户短语与数据库存储值的方式建立接地关系。先前的工作试图通过预先要求语义层来指定接地关系来解决此问题,但这种规范往往不完整,尤其是在领域专家知识中,特定领域的惯例缺乏文档记录。由于这导致同一 SQL 部分存在多个接地假设,我们提出了 GATE(基于执行结果的接地推断),它从执行反馈中引导出缺失的接地关系。GATE 保持接地假设开放,同时执行已接地的部分以获得观察结果。然后,只有被该观察结果支持的假设才被接地并存储为记忆条目,记录测试的内容以及开放部分应如何用 SQL 编写。这些条目累积成执行接地记忆,允许后续步骤重用已被支持的接地关系。在真实世界和受控基准测试中,GATE 持续优于强基线,表明执行不仅可以作为验证,还可以作为文本转 SQL 中可重用记忆的引导机制。 ## 提交历史 来自:Youngwon Lee [查看邮件 (https://arxiv.org/show-email/f1d22049/2606.05634)] **[v1]** 2026 年 6 月 4 日星期四 03:01:04 UTC (15,567 KB)
相似文章
RoboSemanticBench:诊断VLA模型动作预测中的语义基础
RoboSemanticBench 是一个基准测试,用于诊断视觉-语言-动作模型在动作预测中的语义基础,揭示机器人虽然能够抓取物体,但无法根据指令语义选择语义上正确的目标。
可执行模式合约:从自动摄取到多源检索
本文提出一个系统,能够从原始多源数据中自动发现可执行模式,并将其用于知识图谱构建和查询时检索,在多个QA基准测试上优于基线方法。
基于语义奖励的强化学习实现低资源语言扩展而无对齐代价
本文提出使用基于语义奖励的强化学习(通过GRPO)来将LLM扩展到低资源语言,避免了典型的灾难性遗忘对齐代价,展示了相比监督微调更好的语义质量和迁移性。
面向低资源开源Text-to-SQL模型的知识蒸馏
本文提出了一种知识感知的Text-to-SQL框架,利用知识蒸馏在低资源环境下通过构建任务特定的知识库并生成合成训练数据来提升性能。在七个基准上的实验表明,该方法带来了显著的改进,尤其是对于开源模型。
利用生成式AI拓宽交通安全数据获取渠道:一种基于模式框架的空间自然语言查询方法
本文提出了一种基于模式框架的自然语言接口,用于交通安全分析。该接口利用大型语言模型解释用户查询,同时保持对权威数据库的确定性执行。该框架在马萨诸塞州交通安全数据库上进行了评估,成功执行了所有查询,并在29%的案例中纠正了错误,展示了拓宽安全数据获取渠道的实用方法。