collapse-detection

标签

Cards List
#collapse-detection

当Top-1失效时:为掩码扩散语言模型校准LoRA监控器

arXiv cs.LG · 21小时前 缓存

本文研究了top-1崩溃率作为短视界LoRA微调离散扩散语言模型的稳定性监控器的有效性,发现其精度为零,并提出最大梯度范数作为更可靠的替代方案,在LLaDA系列模型上具有更高的精度和F1分数。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈