training-free-diagnostics

标签

Cards List
#training-free-diagnostics

揭秘同策略蒸馏:其益处、危害及原因

Hugging Face Daily Papers · 2026-05-11 缓存

本文介绍了一种无需训练的框架,用于分析推理模型在逐token级别上的蒸馏信号。研究揭示,蒸馏引导在错误推理路径上更为有效,且其效果取决于学生模型的能力及任务上下文。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈