momentum

标签

Cards List
#momentum

MGUP:一种用于随机优化的动量-梯度对齐更新策略

arXiv cs.LG · 2026-06-17 缓存

提出了一种用于随机优化的动量-梯度对齐更新策略MGUP,可实现层内选择性参数更新。该策略能与AdamW、Lion和Muon等优化器无缝集成,在提供理论收敛保证的同时,在大型模型训练任务中展现出卓越性能。

0 人收藏 0 人点赞
#momentum

DP-MacAdam:具有自适应裁剪和自适应动量的差分隐私机制

arXiv cs.LG · 2026-06-05 缓存

DP-MacAdam 结合了自适应裁剪和自适应动量来改进差分隐私随机梯度下降,无需手动调整裁剪阈值即可获得更好的模型效用。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈