用于零样本逻辑规则归纳的基础模型
摘要
本文介绍了神经规则归纳器(NRI),这是一种用于零样本逻辑规则归纳的基础模型,它利用与领域无关的统计特性,无需重新训练即可跨任务进行泛化。
查看缓存全文
缓存时间: 2026/05/08 07:44
论文页面 - A Foundation Model for Zero-Shot Logical Rule Induction
来源:https://huggingface.co/papers/2605.04916
摘要
神经规则归纳器(Neural Rule Inducer, NRI)通过利用域无关的统计属性表示字面量,并使用并行解码来保持逻辑析取中的排列不变性,从而实现了零样本规则归纳。
归纳逻辑编程(https://huggingface.co/papers?q=Inductive%20Logic%20Programming)(ILP)旨在从数据中学习可解释的逻辑规则。现有方法属于转导式学习:其学习到的参数绑定于特定的谓词,因此针对每个新任务都需要重新训练。我们引入了神经规则归纳器(NRI),这是一个用于零样本规则归纳(https://huggingface.co/papers?q=zero-shot%20rule%20induction)的预训练模型(https://huggingface.co/papers?q=pretrained%20model)。NRI 不对字面量身份进行编码,而是使用域无关的统计属性(如类条件比率、熵和共现性)来表示字面量,这些属性无需重新训练即可在不同的变量身份和数量之间泛化。该模型由一个统计编码器(https://huggingface.co/papers?q=statistical%20encoder)和一个基于并行槽位的解码器(https://huggingface.co/papers?q=slot-based%20decoder)组成。并行解码保持了逻辑析取(https://huggingface.co/papers?q=logical%20disjunction)的排列不变性(https://huggingface.co/papers?q=permutation%20invariance);而自回归解码器(https://huggingface.co/papers?q=autoregressive%20decoder)则会强加任意的子句顺序。积 T-范数松弛(https://huggingface.co/papers?q=Product%20T-norm%20relaxation)使得规则执行变得可微,从而允许仅基于预测准确率进行端到端训练。我们在规则恢复、对标签噪声和虚假相关性的鲁棒性,以及向现实世界基准的零样本迁移等方面对 NRI 进行了评估。我们认为这项工作开启了对符号推理的基础模型的可能性。代码和参考检查点可在 https://github.com/phuayj/neural-rule-inducer 获取。
查看 arXiv 页面 (https://arxiv.org/abs/2605.04916) 查看 PDF (https://arxiv.org/pdf/2605.04916) 项目页面 (https://yinjunphua.com/papers/nri/) GitHub1 (https://github.com/phuayj/neural-rule-inducer) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.04916)
在您的 agent 中获取这篇论文:
hf papers read 2605\.04916
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型 1
phuayj/neural-rule-inducer 表格分类• 更新于约 17 小时前 • 68 (https://huggingface.co/phuayj/neural-rule-inducer)
引用此论文的数据集 0
没有与此论文链接的数据集
在数据集的 README.md 中引用 arxiv.org/abs/2605.04916 以从此页面建立链接。
引用此论文的 Space 0
没有与此论文链接的 Space
在 Space 的 README.md 中引用 arxiv.org/abs/2605.04916 以从此页面建立链接。
包含此论文的合集 0
没有包含此论文的合集
将此论文添加到合集 (https://huggingface.co/new-collection) 以从此页面建立链接。
相似文章
TRN-R1-Zero:仅通过强化学习实现富文本网络推理
TRN-R1-Zero 提出一种后训练框架,让大模型在无需监督微调或思维链数据的情况下,仅凭强化学习即可对富文本网络进行零样本推理。
视觉感知到概念的一阶规则学习网络 [R]
本文介绍了gammaILP,一个完全可微的框架,能够直接从图像数据中学习一阶规则,且无标签泄露,解决了符号接地和谓词发明等挑战。
MindZero:零标注下的在线心智推理学习
MindZero 提出了一种自监督强化学习框架,用于训练多模态大语言模型,使其能够高效且鲁棒地进行在线心智推理,而无需心智状态标注,在准确性和效率上均优于基于模型的方法。
使用零样本时间序列基础模型进行功能MRI和合成信号的预测与因果关系分析
本文介绍了一种零样本时间序列基础模型,应用于功能MRI与合成信号的预测和因果关系分析。
发散诱导提示:零样本推理的多理由归纳
发散诱导提示(DIP)通过首先生成多个多样化的理由,将每个理由详细阐述为一个详细计划,然后归纳出最终计划,从而增强零样本推理,其性能优于单一策略提示方法。