reparameterization

标签

Cards List
#reparameterization

@murage_kibicho: 我添加了一个神经排序算法。它基于Stable diffusion中的重参数化技巧!它被称为Gumb…

X AI KOLs Timeline · 3天前 缓存

一个基于Mena等人2018年论文的Gumbel-Sinkhorn神经网络的Python实现,用于对数字列表进行排序。

0 人收藏 0 人点赞
#reparameterization

@HanGuo97: LLM训练建立在快速矩阵乘法(MatMuls)之上。但许多周边操作仍然作为内存受限的内核运行。CODA重新参数化……

X AI KOLs Following · 2026-05-21 缓存

CODA将LLM训练中的内存受限操作重新参数化,将其融合到矩阵乘法的epilogue中,从而利用LLM生成的内核实现了接近最先进的性能。

0 人收藏 0 人点赞
#reparameterization

平坦最小值是幻觉吗?

arXiv cs.LG · 2026-05-08 缓存

本文挑战了关于平坦最小值能导致神经网络更好泛化的普遍观点,认为‘弱性’——一种函数简单性的重参数化不变度量——才是真正的驱动力。在MNIST和Fashion-MNIST上的实验结果表明,弱性能够预测泛化,而尖锐性则与之负相关,且随着训练数据增加,大批次泛化优势消失。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈