step-wise

标签

Cards List
#step-wise

通过协作逐步多教师解码蒸馏长链思维推理

Hugging Face Daily Papers · 2026-05-04 缓存

CoRD是一个协作多教师解码框架,通过预测困惑度评分和束搜索合成推理轨迹,实现了大型推理模型的高效蒸馏,具有高质量输出和泛化性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈