probabilistic-programs

标签

Cards List
#probabilistic-programs

使用概率程序训练大型语言模型的归纳推理

arXiv cs.CL · 2026-06-10 缓存

本文介绍了基于程序的后验训练(PPT),一种利用LLM生成的概率程序来创建分布目标,以微调归纳推理的方法,从而提高了在保留任务和人类对齐基准上的估计准确性和校准能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈