gradient-flow

标签

Cards List
#gradient-flow

大规模线性自编码器中学习机制的三棱柱层次结构

arXiv cs.LG · 2026-06-05 缓存

本文系统性地识别了大型权重共享线性自编码器中所有定性不同的极端学习机制,推导了与三棱柱面相关的五种机制的显式损失演化。

0 人收藏 0 人点赞
#gradient-flow

基于价值梯度流的强化学习

Hugging Face Daily Papers · 2026-04-15 缓存

价值梯度流(VGF)提出了一种可扩展的行为正则化强化学习方法,将其构建为通过离散梯度流求解的最优传输问题,在离线强化学习和大型语言模型强化学习基准测试中取得了最先进的成果。该方法消除了显式的策略参数化,同时通过控制传输预算实现了自适应的测试时缩放。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈