segment-level

标签

Cards List
#segment-level

知道何时停止:用于减少过度思考的段级信用分配

arXiv cs.CL · 昨天 缓存

本文介绍了DASH,一种利用推理轨迹中的中间答案承诺来分配段级信用的方法,可减少过度思考行为并提高竞赛级数学基准的准确性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈