inductive-reasoning

#inductive-reasoning

Using Probabilistic Programs to Train Inductive Reasoning in Large Language Models

arXiv cs.CL ↗ · 2026-06-10 Cached

This paper introduces Program-based Posterior Training (PPT), a method that uses LLM-generated probabilistic programs to create distributional targets for fine-tuning inductive reasoning, improving estimation accuracy and calibration on held-out tasks and human-alignment benchmarks.

0 favorites 0 likes

#inductive-reasoning

FALSIFYBENCH: Evaluating Inductive Reasoning in LLMs with Rule Discovery Games

arXiv cs.AI ↗ · 2026-06-04 Cached

FalsifyBench is a new evaluation framework for assessing inductive reasoning in LLMs, inspired by the Wason 2-4-6 task, where agents discover hidden semantic rules by proposing examples and receiving feedback. Evaluation of 12 LLMs shows reasoning models outperform instruction-tuned models, with negative testing (hypothesis falsification) being the key driver of success.

0 favorites 0 likes

#inductive-reasoning

Boosting Knowledge Graph Foundation Models via Enhanced Negative Sampling

arXiv cs.AI ↗ · 2026-05-27 Cached

Proposes KMAS, an adaptive negative sampling method to improve training of knowledge graph foundation models, achieving state-of-the-art results across 44 datasets.

0 favorites 0 likes

#inductive-reasoning

MIND-Skill: Quality-Guaranteed Skill Generation via Multi-Agent Induction and Deduction

arXiv cs.AI ↗ · 2026-05-12 Cached

MIND-Skill is a new framework introduced in this research paper that automates the generation of high-quality, reusable agent skills using multi-agent induction and deduction with quality guarantees via TextGrad optimization.

0 favorites 0 likes

inductive-reasoning

Using Probabilistic Programs to Train Inductive Reasoning in Large Language Models

FALSIFYBENCH: Evaluating Inductive Reasoning in LLMs with Rule Discovery Games

Boosting Knowledge Graph Foundation Models via Enhanced Negative Sampling

MIND-Skill: Quality-Guaranteed Skill Generation via Multi-Agent Induction and Deduction

Submit Feedback