用于零样本逻辑规则归纳的基础模型

Hugging Face Daily Papers 2026/05/06 00:00 论文

摘要

本文介绍了神经规则归纳器（NRI），这是一种用于零样本逻辑规则归纳的基础模型，它利用与领域无关的统计特性，无需重新训练即可跨任务进行泛化。

归纳逻辑编程（ILP）从数据中学习可解释的逻辑规则。现有方法是转导式的：其学习到的参数绑定到特定的谓词，因此针对每个新任务都需要重新训练。我们引入了神经规则归纳器（NRI），这是一个用于零样本规则归纳的预训练模型。NRI 不编码字面量标识符，而是使用与领域无关的统计特性（如类条件率、熵和共现率）来表示字面量，从而能够在不重新训练的情况下跨变量身份和数量进行泛化。该模型由一个统计编码器和一个并行基于槽位的解码器组成。并行解码保留了逻辑析取的置换不变性；而自回归解码器则会强加任意的子句顺序。积 T-范数松弛使规则执行变得可微，从而允许仅基于预测精度进行端到端训练。我们在规则恢复、对标签噪声和虚假相关性的鲁棒性，以及迁移到现实世界基准的零样本转移方面对 NRI 进行了评估。我们相信这项工作开启了用于符号推理的基础模型的可能性。代码和参考检查点可在此获取：https://github.com/phuayj/neural-rule-inducer。

查看原文

查看缓存全文

缓存时间: 2026/05/08 07:44

论文页面 - A Foundation Model for Zero-Shot Logical Rule Induction

来源：https://huggingface.co/papers/2605.04916

摘要

神经规则归纳器（Neural Rule Inducer, NRI）通过利用域无关的统计属性表示字面量，并使用并行解码来保持逻辑析取中的排列不变性，从而实现了零样本规则归纳。

归纳逻辑编程（https://huggingface.co/papers?q=Inductive%20Logic%20Programming）（ILP）旨在从数据中学习可解释的逻辑规则。现有方法属于转导式学习：其学习到的参数绑定于特定的谓词，因此针对每个新任务都需要重新训练。我们引入了神经规则归纳器（NRI），这是一个用于零样本规则归纳（https://huggingface.co/papers?q=zero-shot%20rule%20induction）的预训练模型（https://huggingface.co/papers?q=pretrained%20model）。NRI 不对字面量身份进行编码，而是使用域无关的统计属性（如类条件比率、熵和共现性）来表示字面量，这些属性无需重新训练即可在不同的变量身份和数量之间泛化。该模型由一个统计编码器（https://huggingface.co/papers?q=statistical%20encoder）和一个基于并行槽位的解码器（https://huggingface.co/papers?q=slot-based%20decoder）组成。并行解码保持了逻辑析取（https://huggingface.co/papers?q=logical%20disjunction）的排列不变性（https://huggingface.co/papers?q=permutation%20invariance）；而自回归解码器（https://huggingface.co/papers?q=autoregressive%20decoder）则会强加任意的子句顺序。积 T-范数松弛（https://huggingface.co/papers?q=Product%20T-norm%20relaxation）使得规则执行变得可微，从而允许仅基于预测准确率进行端到端训练。我们在规则恢复、对标签噪声和虚假相关性的鲁棒性，以及向现实世界基准的零样本迁移等方面对 NRI 进行了评估。我们认为这项工作开启了对符号推理的基础模型的可能性。代码和参考检查点可在 https://github.com/phuayj/neural-rule-inducer 获取。

查看 arXiv 页面 (https://arxiv.org/abs/2605.04916) 查看 PDF (https://arxiv.org/pdf/2605.04916) 项目页面 (https://yinjunphua.com/papers/nri/) GitHub1 (https://github.com/phuayj/neural-rule-inducer) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.04916)

在您的 agent 中获取这篇论文：

hf papers read 2605\.04916

没有最新的 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型 1

phuayj/neural-rule-inducer 表格分类• 更新于约 17 小时前 • 68 (https://huggingface.co/phuayj/neural-rule-inducer)

引用此论文的数据集 0

没有与此论文链接的数据集

在数据集的 README.md 中引用 arxiv.org/abs/2605.04916 以从此页面建立链接。

引用此论文的 Space 0

没有与此论文链接的 Space

在 Space 的 README.md 中引用 arxiv.org/abs/2605.04916 以从此页面建立链接。

包含此论文的合集 0

没有包含此论文的合集

将此论文添加到合集 (https://huggingface.co/new-collection) 以从此页面建立链接。

用于零样本逻辑规则归纳的基础模型

论文页面 - A Foundation Model for Zero-Shot Logical Rule Induction

摘要

引用此论文的模型 1

phuayj/neural-rule-inducer 表格分类• 更新于约 17 小时前 • 68 (https://huggingface.co/phuayj/neural-rule-inducer)

引用此论文的数据集 0

引用此论文的 Space 0

包含此论文的合集 0

相似文章

TRN-R1-Zero：仅通过强化学习实现富文本网络推理

视觉感知到概念的一阶规则学习网络 [R]

MindZero：零标注下的在线心智推理学习

使用零样本时间序列基础模型进行功能MRI和合成信号的预测与因果关系分析

发散诱导提示：零样本推理的多理由归纳

提交意见反馈