inductive-reasoning

标签

Cards List
#inductive-reasoning

使用概率程序训练大型语言模型的归纳推理

arXiv cs.CL · 2026-06-10 缓存

本文介绍了基于程序的后验训练(PPT),一种利用LLM生成的概率程序来创建分布目标,以微调归纳推理的方法,从而提高了在保留任务和人类对齐基准上的估计准确性和校准能力。

0 人收藏 0 人点赞
#inductive-reasoning

FALSIFYBENCH:利用规则发现游戏评估大语言模型的归纳推理能力

arXiv cs.AI · 2026-06-04 缓存

FalsifyBench 是一个用于评估大语言模型归纳推理能力的新型评测框架,灵感来源于 Wason 2-4-6 任务。在该框架中,智能体通过提出示例并接收反馈来发现隐藏的语义规则。对 12 个大语言模型的评估结果表明,推理模型的表现优于指令微调模型,而负面测试(即假设证伪)是决定成败的关键因素。

0 人收藏 0 人点赞
#inductive-reasoning

通过增强负采样提升知识图谱基础模型

arXiv cs.AI · 2026-05-27 缓存

提出了KMAS,一种自适应负采样方法,用于改进知识图谱基础模型的训练,在44个数据集上取得了最先进的结果。

0 人收藏 0 人点赞
#inductive-reasoning

MIND-Skill:通过多智能体归纳与演绎实现质量保证的技能生成

arXiv cs.AI · 2026-05-12 缓存

MIND-Skill 是本研究论文提出的一种新框架,它利用基于 TextGrad 优化的多智能体归纳和演绎,自动化生成高质量、可复用的智能体技能,并提供质量保证。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈