从执行结果自举文本到SQL的语义层

arXiv cs.CL 2026/06/05 04:00 论文

text-to-sql semantic-layer bootstrapping execution-feedback grounding database natural-language-processing

摘要

介绍GATE（从执行结果中测试后接地）方法，该方法从执行反馈中自举缺失的语义接地，以处理文本到SQL任务中未明确指定的用户短语，持续提升超越强基线。

arXiv:2606.05634v1 公告类型：新摘要：现实世界的文本到SQL任务通常需要用户短语在数据库如何存储值的基础上进行接地后才能明确。先前的工作尝试通过要求预先指定语义层来提供接地来解决此问题，但此类规范往往不完整，尤其是在领域特定约定缺乏文档记录的专家领域。由于这为同一SQL部分留下了多个接地假设，我们引入了GATE（从执行结果中测试后接地），该方法从执行反馈中自举缺失的接地。GATE在保持接地假设开放的同时，执行已接地的部分以获得观察结果。然后，仅当假设得到该观察结果支持时，才将其接地并存储为记忆条目，记录测试了什么以及开放部分应如何用SQL编写。这些条目累积形成执行接地记忆，允许后续步骤重用支持的接地。在真实世界和受控基准测试中，GATE持续超越强基线，证明执行不仅可以作为验证手段，还可以作为文本到SQL中可重用记忆的自举机制。

查看原文

查看缓存全文

缓存时间: 2026/06/05 08:07

# 从执行结果引导语义层用于文本转 SQL
来源：https://arxiv.org/abs/2606.05634
查看 PDF (https://arxiv.org/pdf/2606.05634)

> 摘要：现实世界中的文本转 SQL 任务常常存在未明确指定的情况，直到用户短语与数据库存储值的方式建立接地关系。先前的工作试图通过预先要求语义层来指定接地关系来解决此问题，但这种规范往往不完整，尤其是在领域专家知识中，特定领域的惯例缺乏文档记录。由于这导致同一 SQL 部分存在多个接地假设，我们提出了 GATE（基于执行结果的接地推断），它从执行反馈中引导出缺失的接地关系。GATE 保持接地假设开放，同时执行已接地的部分以获得观察结果。然后，只有被该观察结果支持的假设才被接地并存储为记忆条目，记录测试的内容以及开放部分应如何用 SQL 编写。这些条目累积成执行接地记忆，允许后续步骤重用已被支持的接地关系。在真实世界和受控基准测试中，GATE 持续优于强基线，表明执行不仅可以作为验证，还可以作为文本转 SQL 中可重用记忆的引导机制。

## 提交历史

来自：Youngwon Lee [查看邮件 (https://arxiv.org/show-email/f1d22049/2606.05634)] **[v1]** 2026 年 6 月 4 日星期四 03:01:04 UTC (15,567 KB)

从执行结果自举文本到SQL的语义层

相似文章

超越静态规则：Text-to-SQL 中潜在漏洞的自动发现

通过自增强微调在Text-to-SQL中整合推理与泛化

一种基于语义层的异构企业数据库自然语言转SQL智能体

RoboSemanticBench：诊断VLA模型动作预测中的语义基础

Genie Ontology 如何真正提高 text-to-SQL 准确率——机制而非宣传

提交意见反馈