标签
本文表明,交叉熵和监督对比学习都是超球面上的原型学习形式,并提出了归一化损失函数(NTCE和NONL),这些损失函数通过设计实现Neural Collapse,性能优于标准方法。
本文利用KL散度和Bregman几何,推导了信念空间动力学中允许的学习率步长的闭式上界,重点关注交叉熵分类任务。