process-scorer

标签

Cards List
#process-scorer

现成LLM作为过程评分器:数学推理中无需训练的PRM替代方案

Hugging Face Daily Papers · 4天前 缓存

提出块级引导生成(Chunk-Level Guided Generation),一种无需训练的方法,利用现成LLM作为过程评分器,在小模型生成过程中选择固定长度的候选块,相比多数投票和PRM引导搜索,显著提升数学推理准确性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈