feedback-alignment

标签

Cards List
#feedback-alignment

反馈对齐在自蒸馏中的作用

Hugging Face Daily Papers · 2026-06-09 缓存

本文研究了语言模型中自蒸馏的上下文设计,发现逐步对齐的批评反馈显著优于二元奖励或参考解条件,因为它只针对错误词元,同时保留正确行为。

0 人收藏 0 人点赞
#feedback-alignment

反馈对齐在卷积网络中的生物合理性与表征一致性

arXiv cs.AI · 2026-05-12 缓存

本文评估了反馈对齐算法在卷积网络中的生物合理性与表征一致性,并在 CIFAR-10 数据集上将其与标准反向传播进行了对比。作者发现,改进的反馈对齐方法收敛出的内部表征与反向传播产生的表征相似,这表明其功能上的成功源于对表征几何结构的模仿。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈