标签
一篇研究神经网络超参数化成功原因的论文,比较了彩票假说与逃逸维度。
OpenAI研究揭示了“双下降”现象,即测试误差随着模型规模和训练步数的增加呈现出非单调的模式,挑战了传统上对深度学习偏差-方差权衡的理解。