从执行结果自举文本到SQL的语义层

arXiv cs.CL 论文

摘要

介绍GATE(从执行结果中测试后接地)方法,该方法从执行反馈中自举缺失的语义接地,以处理文本到SQL任务中未明确指定的用户短语,持续提升超越强基线。

arXiv:2606.05634v1 公告类型:新 摘要:现实世界的文本到SQL任务通常需要用户短语在数据库如何存储值的基础上进行接地后才能明确。先前的工作尝试通过要求预先指定语义层来提供接地来解决此问题,但此类规范往往不完整,尤其是在领域特定约定缺乏文档记录的专家领域。由于这为同一SQL部分留下了多个接地假设,我们引入了GATE(从执行结果中测试后接地),该方法从执行反馈中自举缺失的接地。GATE在保持接地假设开放的同时,执行已接地的部分以获得观察结果。然后,仅当假设得到该观察结果支持时,才将其接地并存储为记忆条目,记录测试了什么以及开放部分应如何用SQL编写。这些条目累积形成执行接地记忆,允许后续步骤重用支持的接地。在真实世界和受控基准测试中,GATE持续超越强基线,证明执行不仅可以作为验证手段,还可以作为文本到SQL中可重用记忆的自举机制。
查看原文
查看缓存全文

缓存时间: 2026/06/05 08:07

# 从执行结果引导语义层用于文本转 SQL
来源:https://arxiv.org/abs/2606.05634
查看 PDF (https://arxiv.org/pdf/2606.05634)

> 摘要:现实世界中的文本转 SQL 任务常常存在未明确指定的情况,直到用户短语与数据库存储值的方式建立接地关系。先前的工作试图通过预先要求语义层来指定接地关系来解决此问题,但这种规范往往不完整,尤其是在领域专家知识中,特定领域的惯例缺乏文档记录。由于这导致同一 SQL 部分存在多个接地假设,我们提出了 GATE(基于执行结果的接地推断),它从执行反馈中引导出缺失的接地关系。GATE 保持接地假设开放,同时执行已接地的部分以获得观察结果。然后,只有被该观察结果支持的假设才被接地并存储为记忆条目,记录测试的内容以及开放部分应如何用 SQL 编写。这些条目累积成执行接地记忆,允许后续步骤重用已被支持的接地关系。在真实世界和受控基准测试中,GATE 持续优于强基线,表明执行不仅可以作为验证,还可以作为文本转 SQL 中可重用记忆的引导机制。

## 提交历史

来自:Youngwon Lee [查看邮件 (https://arxiv.org/show-email/f1d22049/2606.05634)] **[v1]** 2026 年 6 月 4 日星期四 03:01:04 UTC (15,567 KB)

相似文章

面向低资源开源Text-to-SQL模型的知识蒸馏

arXiv cs.CL

本文提出了一种知识感知的Text-to-SQL框架,利用知识蒸馏在低资源环境下通过构建任务特定的知识库并生成合成训练数据来提升性能。在七个基准上的实验表明,该方法带来了显著的改进,尤其是对于开源模型。

利用生成式AI拓宽交通安全数据获取渠道:一种基于模式框架的空间自然语言查询方法

arXiv cs.CL

本文提出了一种基于模式框架的自然语言接口,用于交通安全分析。该接口利用大型语言模型解释用户查询,同时保持对权威数据库的确定性执行。该框架在马萨诸塞州交通安全数据库上进行了评估,成功执行了所有查询,并在29%的案例中纠正了错误,展示了拓宽安全数据获取渠道的实用方法。