initialization

标签

Cards List
#initialization

深度网络会遗忘初始化吗?实际归纳偏置的遗忘时间视角

arXiv cs.LG · 6天前 缓存

本文引入了“初始化记忆”的概念,研究深度网络中随机初始化偏差在训练后保留了多少,表明低学习率的SGD能保留初始化,而Adam系列优化器则消除它,并将其与遗忘动力学联系起来。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈