DisasterLex：面向灾害分析中地理空间推理的专家概念到模式知识图谱

arXiv cs.LG 2026/06/01 04:00 论文

disaster-analytics knowledge-graph text-to-sql geospatial-reasoning llm data-access

摘要

DisasterLex 引入了一种知识图谱中介框架，通过使用包含因果边的专家知识图谱来约束模式并指导查询规划，从而改进灾害分析中的文本到 SQL 转换，性能优于现有最先进的基线方法。

arXiv:2605.30538v1 公告类型：新摘要：灾害不可避免且日益造成巨大损失，有效应对依赖于查询结构化表格数据——这些灾害管理所依赖的精确、信息密集的灾害、暴露度、脆弱性和生命线基础设施记录。当前文本到 SQL 方法支持对这类表格的自然语言访问，但迁移到灾害领域时效果不佳，因为该领域的查询涉及异质地理空间模式，且需要对因果关系进行推理。我们提出 DisasterLex，这是一种知识图谱中介框架，在用户查询与数据库之间插入一个包含精心策划的概念和带类型因果边的专家知识图谱（EKG），并通过概念到表格的链接与模式桥接。该编排流程分为四个阶段（识别查询实体、路由到操作领域、基于因果边进行规划、以及生成 SQL），在每一步限制传递给模型的模式。我们在一个灾害分析数据库（36 个地理空间表、150 列）上实现了该框架，EKG 包含 107 个概念、117 条因果边和 52 个概念到模式的链接，并在一个包含 75 个查询的测试集上进行了评估。在涵盖专有和开源系列的七个基础模型上，DisasterLex 以 1.4 倍到 2.75 倍的性能优势击败了四种最先进的基线方法（LightRAG、HippoRAG 2、ReFoRCE、CHESS），绝对得分范围为 1.65 到 3.56（满分 5.0）。错误分析表明，基线方法的失败集中在路由和多表 SQL 组合上，而这正是我们的编排流程明确解决的问题。代码、数据和 EKG 工件可在 https://github.com/YimingXiao98/DisasterLex 获取，也可见于 Zenodo 的 https://doi.org/10.5281/zenodo.20388029。

查看原文

查看缓存全文

缓存时间: 2026/06/01 09:26

# DisasterLex：面向灾害分析中地理空间推理的专家概念到模式知识图谱  
来源：https://arxiv.org/html/2605.30538  
Yiming Xiao*，Ankit Basu，Kai Yin，Sahil Vartak，Christian Swords，Ali Mostafavi  
德克萨斯农工大学  
\{yxiao, ankitbasu, kai_yin, svartak, c.swords.9102, mostafavi\}@tamu.edu  

###### 摘要  
灾害不可避免且代价日益高昂，有效响应依赖于对结构化表格数据的查询：这些精确、信息密集的记录涵盖了灾害管理所依赖的灾害、暴露度、脆弱性以及生命线基础设施。当前的文本到SQL方法支持自然语言访问此类表格，但在灾害领域表现不佳，因为查询涉及异构的地理空间模式，并且需要对因果关系进行推理。我们提出DisasterLex，一个知识图谱介导的框架，它在用户查询和数据库之间插入一个由精心策划的概念和类型化因果边构成的专家知识图谱（EKG），并通过概念到表格的链接与模式桥接。该编排运行四个阶段（识别查询实体、路由到操作领域、在因果边上规划、以及生成SQL），每一步都限制传递给模型的模式。我们将其实例化在一个灾害分析数据库（36个地理空间表，150列）上，该数据库的EKG包含107个概念、117条因果边和52个概念到模式的链接，并在75个查询的测试集上进行了评估。在所有跨越专有和开源家族的基础模型上，DisasterLex的表现比四个最先进的基线（LightRAG、HippoRAG 2、ReFoRCE、CHESS）高出1.4倍到2.75倍，绝对得分（满分5.0分）为1.65到3.56。错误分析显示，基线的失败集中在路由和多表SQL组合上，这正是我们的编排明确解决的操作。代码、数据和EKG工件可在此仓库（https://github.com/YimingXiao98/DisasterLex）以及Zenodo（https://doi.org/10.5281/zenodo.20388029）获取。  

## 1 引言  
灾害，无论自然还是技术性的，都不可避免地引发严重的社会、经济和人类后果（Fan等，2021；Lei等，2025）。在这些事件中，应急分析师、事故指挥官和受灾人群依赖于快速、准确地访问结构化的地理空间数据（灾害暴露、人口脆弱性、生命线基础设施准备情况），以在时间紧迫的决策约束下协调响应（联邦紧急事务管理局，2017；Comfort，2007；Bharosa等，2010）。可靠的自然语言访问这些数据可以大幅降低分析师问题与底层表格之间的障碍，但这些数据本身抵制通用语言工具：它跨越数十个具有专门语义的异构表格，其中哨兵值标记缺失，不同数据集之间的分数方向相反（某个指数上更高意味着更有韧性，但在另一个指数上却更脆弱），而且领域专家推理的因果关系（例如，低社区韧性降低应急响应能力，洪水深度增加结构损坏，电力中断级联影响医院运营）必须编码为外部知识供LLM使用。  

当前的几种自然语言数据访问方法在这种环境下因不同原因而失败。文本到SQL系统（Yu等，2018；Li等，2023b；Pourreza和Rafiei，2023）假设一个较小或预选的模式；在我们的规模下，将完整的150列模式注入每个文本到SQL提示在现代上下文长度下技术上是可行的，但会在语义无关的表之间稀释注意力，产生幻象连接，例如在仅共享hex_id键的洪水风险表和无关人口统计表之间。标准的检索增强生成（RAG）（Lewis等，2020；Gao等，2023）检索的是文本段落，而我们需要的是结构化表格上的可执行SQL。图增强的RAG（Edge等，2024；Peng等，2024）从文档语料库构建知识图谱以改进段落检索，但并未解决制约结构化查询回答的模式选择问题。专为干净的BIRD类基准设计的多智能体文本到SQL流水线（如CHESS（Talaei等，2024））同样依赖列名启发式进行模式链接，且不编码领域因果结构。  

为弥补这一差距，我们提出DisasterLex，一个知识图谱介导的智能体框架，用于灾害分析中的结构化问答。其核心是一个概念级别的模式链接层：一个由专家精心策划的领域概念图及类型化因果边，映射到可执行的数据库模式。该图在表选择步骤中调解用户词汇和列名，而SQL生成则留给LLM。一个四阶段编排流水线（关键性提取、操作驱动的路由、因果信息规划、接地执行）强制实施领域专家已经遵循的操作结构。与先前的图增强检索、模式链接和文本到SQL系统不同，DisasterLex使用一个专家策划的因果概念图作为结构化表之上特定领域的模式选择层，其动机源自目标领域的功能结构，而非这些系统设计的通用检索场景。  

#### 贡献。  
(1) **通过专家策划的类型化因果图实现概念级模式链接**。我们通过插入一个包含107个领域概念和117条类型化因果边的专家知识图谱（EKG），以及52条显式概念到模式边，解决了先前文本到SQL和RAG方法的模式选择失败模式。基于同义词的概念匹配加上一跳图遍历，将提示模式上下文从150列减少到通常每查询10-20列。  
(2) **一个受ICS启发的四阶段编排流水线，其组件各自承担重要负载**。我们将灾害分析查询分解为关键性提取、三簇路由、因果信息规划和工具增强执行，而不是依赖单一的ReAct循环（Yao等，2023；联邦紧急事务管理局，2017；Bigley and Roberts，2001）。在Gemini上消除路由使Tier M（多表组合）降低了-1.50；在多个模型上消除规划使Tier K降低了-0.29到-3.19，表明编排选择与基础模型能力之间存在非平凡的交互。  
(3) **一个四层诊断基准**。包含75个查询的测试集，与开发调优分离，组织成四个层级，分别隔离地理空间数据库自然语言接口的不同失败模式（路由、EKG接地、多表组合、数据可用性披露）。每个层级的得分定位了SOTA外部系统崩溃的位置，最大差距集中在路由和多表组合上（表2）。  
(4) **跨模型证据及量化种子方差**。五种条件的消融（完整流水线加四种内部组件消融）在七个架构多样化的基础模型上重复运行，这些模型涵盖闭源和开源家族（Gemini 3.1 Flash-Lite Preview、DeepSeek V3.2、Qwen 3.6 Flash、Llama 3.1 8B、Qwen3 8B、Qwen3 32B、Llama 3.3 70B），每个单元格使用三个随机种子，同时与四个最先进的外部比较器对比：两个图RAG检索器（LightRAG（Guo等，2024）、HippoRAG 2（Gutiérrez等，2025））和两个多智能体文本到SQL流水线（CHESS（Talaei等，2024）、ReFoRCE（Deng等，2025））。完整流水线在每个基础模型上都优于所有通用检索替代方案和文本到SQL竞争对手，但跨模型消融差异揭示了显著的异质性（例如，DeepSeek对编排移除最容忍，Qwen 3.6最不容忍），这限定了任何关于“流水线结构重要”的说法取决于涉及的基础模型。  

## 2 系统架构  
图1：DisasterLex架构。一个自然语言查询流经四个阶段：(1) 上下文与关键性提取，(2) 操作领域分类到特定领域簇，(3) 一个ReAct规划器，侦察EKG和网络，(4) 一个ReAct执行器，在DuckDB上运行概念感知的SQL并遍历EKG因果规则以综合事件报告。专家策划的因果知识图谱通过Maps_To边桥接到关系数据库。  

DisasterLex由三个集成组件组成，总结于图1：一个统一知识图谱（§2.1）、一个概念感知模式检索机制（§2.2）和一个四阶段编排流水线（§2.3）。  

### 2.1 统一知识图谱  
统一图托管在Neo4j（Webber, 2012）中，结合了关系模式的忠实表示和策划的领域因果知识。  

#### 灾害数据目录图（DDCG）。  
从关系数据库自动内省生成：每个表是一个DataTable节点，带有子DataColumn节点，JoinRule节点编码每个表主键列上的有效连接模式。在我们的案例研究（§3）中，DDCG是从一个DuckDB（Raasveldt and Mühleisen，2019）构建的数据库自动内省得到的，该数据库包含36个地理空间表（150列），基于H3（层次六边形）网格（Brodsky，2018；Sahr等，2003），分辨率为8，通过共享的hex_id键连接。  

#### 专家知识图谱（EKG）。  
一个由Concept节点组成的有向图，通过类型化因果边（类型：Increases、Reduces、Indicates、Requires、Scales）连接，每条边带有[0,1]的置信权重。每个概念带有一个同义词列表，支持自然语言的模糊匹配。在我们的案例研究中，EKG有107个概念节点和117条因果边，涵盖八个概念类别（特征、中间过程、结果、领域锚点、干预、暴露、响应资产、基础设施），约85个别名。  

#### 概念到模式桥接。  
一组52条边将EKG概念节点连接到当前DuckDB构建中加载的DDCG数据表。例如，flood_occurrence映射到HP_FLD_002，即国家风险指数的河流洪水风险表（联邦紧急事务管理局，2025）；hospitals映射到EX_LIFE_004，即医院设施计数表。  

#### EKG策划过程。  
EKG是迭代开发的，基于领域文献；每条因果边要么有明确的引用来源，要么有清晰蕴含的机制（例如，imperviousIncreasesrunoff，基于水文过程文献（Schueler，1994））。同义词列表通过LLM建议的别名进行引导，并根据列文档手动筛选；验证使用针对基准的跟踪级别抽查。案例研究的来源列表（取自NIMS（联邦紧急事务管理局，2017）、NRI方法论（联邦紧急事务管理局，2025）以及同行评审的洪水、飓风、社会脆弱性和社区韧性文献）随工件一起发布。  

### 2.2 概念感知模式检索  
模式检索将自然语言查询转换为SQL生成所需的数据库模式子集。该过程有三个步骤：(i) 基于同义词的概念匹配，针对所有EKG概念节点，使用令牌边界正则表达式，优先匹配最长同义词；(ii) Cypher遍历从激活概念到DataTable节点的概念到模式边，检索列、连接规则和数据质量警告（始终包含一个交叉表以支持跨表连接）；(iii) 将生成的紧凑模式块注入SQL生成提示，替代完整模式。在我们的案例研究中，这通常产生10-20列，而朴素注入是150列。例如，给定案例研究查询“给定县内有多少家医院位于洪水暴露区？”，概念匹配激活flood_occurrence和hospitals；遍历返回HP_FLD_002、EX_LIFE_004和交叉表（共12列）。  

### 2.3 流水线编排  
编排器是一个四阶段流水线，在LangGraph中实现为有向图（每个阶段一个节点）。(1) **上下文提取**解析查询上下文（关注区域、灾害或主题、1-5级关键性；关键性≥3门控高关键性建议），并运行数据可用性检查，暴露缺失或阻止的表。该检查是基于规则的：策划的哨兵值模式（例如，在我们的案例研究中，sovi=-999表示缺失社会脆弱性数据）和禁止表列表与概念到表激活集匹配，任何命中都会产生显式披露，传递给下游阶段。(2) **簇路由**将查询分类为k个特定领域的操作簇，每个簇有专门的提示模板。在我们的案例研究中，三个簇（生命安全保障操作、损害评估与响应、基础设施缓解）遵循事件指挥系统（联邦紧急事务管理局，2017；Bigley and Roberts，2001）；显式的ICS映射见附录F。(3) **因果信息规划**是一个ReAct（Yao等，2023）智能体，从EKG检索因果边并生成结构化分析计划。(4) **工具增强执行**是第二个ReAct智能体，配有文本到SQL工具（概念感知模式检索、基于LLM的SQL生成、拒绝DELETE/DROP和引用禁止表的语法验证、DuckDB执行、验证或执行错误时最多3次重试）和一个知识图谱工具（一跳边检索和多跳Cypher遍历，最多3跳）。  

## 3 评估设计  
#### 案例研究与数据集。  
我们以德克萨斯州范围的灾害分析数据库作为案例研究。

DisasterLex：面向灾害分析中地理空间推理的专家概念到模式知识图谱

相似文章

社交媒体中因果关系提取的大型语言模型：灾害情报的验证框架

利用生成式AI拓宽交通安全数据获取渠道：一种基于模式框架的空间自然语言查询方法

面向地理空间数据检索的风险感知LLM代理：设计与初步对抗性评估

GRID：用于安全文本知识图谱构建的情报数据图形表示

我构建了一个开源知识图谱管道，结合混合检索以改进LLM多跳推理 [P]

提交意见反馈