reasoning-space-compression

标签

Cards List
#reasoning-space-compression

通过推理空间压缩的结构化理由蒸馏

arXiv cs.CL · 3天前 缓存

本文提出了 D-RPC,一种通过将推理路径压缩为可复用库,从而将大型语言模型的推理能力蒸馏给较小模型的方法,该方法在数学和常识基准测试中实现了更好的性能和一致性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈