用于零样本逻辑规则归纳的基础模型

Hugging Face Daily Papers 论文

摘要

本文介绍了神经规则归纳器(NRI),这是一种用于零样本逻辑规则归纳的基础模型,它利用与领域无关的统计特性,无需重新训练即可跨任务进行泛化。

归纳逻辑编程(ILP)从数据中学习可解释的逻辑规则。现有方法是转导式的:其学习到的参数绑定到特定的谓词,因此针对每个新任务都需要重新训练。我们引入了神经规则归纳器(NRI),这是一个用于零样本规则归纳的预训练模型。NRI 不编码字面量标识符,而是使用与领域无关的统计特性(如类条件率、熵和共现率)来表示字面量,从而能够在不重新训练的情况下跨变量身份和数量进行泛化。该模型由一个统计编码器和一个并行基于槽位的解码器组成。并行解码保留了逻辑析取的置换不变性;而自回归解码器则会强加任意的子句顺序。积 T-范数松弛使规则执行变得可微,从而允许仅基于预测精度进行端到端训练。我们在规则恢复、对标签噪声和虚假相关性的鲁棒性,以及迁移到现实世界基准的零样本转移方面对 NRI 进行了评估。我们相信这项工作开启了用于符号推理的基础模型的可能性。代码和参考检查点可在此获取:https://github.com/phuayj/neural-rule-inducer。
查看原文
查看缓存全文

缓存时间: 2026/05/08 07:44

论文页面 - A Foundation Model for Zero-Shot Logical Rule Induction

来源:https://huggingface.co/papers/2605.04916

摘要

神经规则归纳器(Neural Rule Inducer, NRI)通过利用域无关的统计属性表示字面量,并使用并行解码来保持逻辑析取中的排列不变性,从而实现了零样本规则归纳。

归纳逻辑编程(https://huggingface.co/papers?q=Inductive%20Logic%20Programming)(ILP)旨在从数据中学习可解释的逻辑规则。现有方法属于转导式学习:其学习到的参数绑定于特定的谓词,因此针对每个新任务都需要重新训练。我们引入了神经规则归纳器(NRI),这是一个用于零样本规则归纳(https://huggingface.co/papers?q=zero-shot%20rule%20induction)的预训练模型(https://huggingface.co/papers?q=pretrained%20model)。NRI 不对字面量身份进行编码,而是使用域无关的统计属性(如类条件比率、熵和共现性)来表示字面量,这些属性无需重新训练即可在不同的变量身份和数量之间泛化。该模型由一个统计编码器(https://huggingface.co/papers?q=statistical%20encoder)和一个基于并行槽位的解码器(https://huggingface.co/papers?q=slot-based%20decoder)组成。并行解码保持了逻辑析取(https://huggingface.co/papers?q=logical%20disjunction)的排列不变性(https://huggingface.co/papers?q=permutation%20invariance);而自回归解码器(https://huggingface.co/papers?q=autoregressive%20decoder)则会强加任意的子句顺序。积 T-范数松弛(https://huggingface.co/papers?q=Product%20T-norm%20relaxation)使得规则执行变得可微,从而允许仅基于预测准确率进行端到端训练。我们在规则恢复、对标签噪声和虚假相关性的鲁棒性,以及向现实世界基准的零样本迁移等方面对 NRI 进行了评估。我们认为这项工作开启了对符号推理的基础模型的可能性。代码和参考检查点可在 https://github.com/phuayj/neural-rule-inducer 获取。

查看 arXiv 页面 (https://arxiv.org/abs/2605.04916) 查看 PDF (https://arxiv.org/pdf/2605.04916) 项目页面 (https://yinjunphua.com/papers/nri/) GitHub1 (https://github.com/phuayj/neural-rule-inducer) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.04916)

在您的 agent 中获取这篇论文:

hf papers read 2605\.04916

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型 1

phuayj/neural-rule-inducer 表格分类• 更新于约 17 小时前 • 68 (https://huggingface.co/phuayj/neural-rule-inducer)

引用此论文的数据集 0

没有与此论文链接的数据集

在数据集的 README.md 中引用 arxiv.org/abs/2605.04916 以从此页面建立链接。

引用此论文的 Space 0

没有与此论文链接的 Space

在 Space 的 README.md 中引用 arxiv.org/abs/2605.04916 以从此页面建立链接。

包含此论文的合集 0

没有包含此论文的合集

将此论文添加到合集 (https://huggingface.co/new-collection) 以从此页面建立链接。

相似文章

MindZero:零标注下的在线心智推理学习

arXiv cs.AI

MindZero 提出了一种自监督强化学习框架,用于训练多模态大语言模型,使其能够高效且鲁棒地进行在线心智推理,而无需心智状态标注,在准确性和效率上均优于基于模型的方法。

发散诱导提示:零样本推理的多理由归纳

arXiv cs.AI

发散诱导提示(DIP)通过首先生成多个多样化的理由,将每个理由详细阐述为一个详细计划,然后归纳出最终计划,从而增强零样本推理,其性能优于单一策略提示方法。