linear-minimization-oracle

标签

Cards List
#linear-minimization-oracle

通过隐式梯度传输加速基于 LMO 的优化

arXiv cs.LG · 5天前 缓存

本文提出了 LMO-IGT,这是一类新的随机优化方法,它利用隐式梯度传输来加速收敛,同时保持每次迭代仅计算一次梯度的结构。文中引入了一个统一的理论框架,并展示了相较于 Muon 等现有基于 LMO 的优化器,该方法具有更优的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈