inductive-reasoning

#inductive-reasoning

使用概率程序训练大型语言模型的归纳推理

arXiv cs.CL ↗ · 2026-06-10 缓存

本文介绍了基于程序的后验训练（PPT），一种利用LLM生成的概率程序来创建分布目标，以微调归纳推理的方法，从而提高了在保留任务和人类对齐基准上的估计准确性和校准能力。

0 人收藏 0 人点赞

#inductive-reasoning

arXiv cs.AI ↗ · 2026-06-04 缓存

FalsifyBench 是一个用于评估大语言模型归纳推理能力的新型评测框架，灵感来源于 Wason 2-4-6 任务。在该框架中，智能体通过提出示例并接收反馈来发现隐藏的语义规则。对 12 个大语言模型的评估结果表明，推理模型的表现优于指令微调模型，而负面测试（即假设证伪）是决定成败的关键因素。

0 人收藏 0 人点赞

#inductive-reasoning

arXiv cs.AI ↗ · 2026-05-27 缓存

提出了KMAS，一种自适应负采样方法，用于改进知识图谱基础模型的训练，在44个数据集上取得了最先进的结果。

0 人收藏 0 人点赞

#inductive-reasoning

arXiv cs.AI ↗ · 2026-05-12 缓存

MIND-Skill 是本研究论文提出的一种新框架，它利用基于 TextGrad 优化的多智能体归纳和演绎，自动化生成高质量、可复用的智能体技能，并提供质量保证。

0 人收藏 0 人点赞