mnist

标签

Cards List
#mnist

Bit-Mass理论——容器原理

Reddit r/artificial · 2026-05-31

Bit-Mass理论提出,决定模型准确率的是权重位的总数,而非计算格式。在MNIST上的实验表明,相同的Bit-Mass下,二进制网络与浮点网络性能相当。

0 人收藏 0 人点赞
#mnist

平坦最小值是幻觉吗?

arXiv cs.LG · 2026-05-08 缓存

本文挑战了关于平坦最小值能导致神经网络更好泛化的普遍观点,认为‘弱性’——一种函数简单性的重参数化不变度量——才是真正的驱动力。在MNIST和Fashion-MNIST上的实验结果表明,弱性能够预测泛化,而尖锐性则与之负相关,且随着训练数据增加,大批次泛化优势消失。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈