deep-learning-theory

标签

Cards List
#deep-learning-theory

稳定边缘选择性塑造数据分布上的学习

arXiv cs.LG · 2026-06-04 缓存

MIT研究人员表明,神经网络训练中的稳定边缘(EoS)不仅仅是一个全局优化现象,而是选择性地在训练分布的子集上重新分配学习,放大某些数据组的进展同时抑制其他组。他们识别出控制这种分配的两个关键条件:梯度与Hessian矩阵最大特征向量的对齐,以及持续非消失的梯度幅度。

0 人收藏 0 人点赞
#deep-learning-theory

神经网络可证明学习群组合的谱表示

arXiv cs.LG · 2026-06-03 缓存

本文从理论上证明,在群组合任务上训练的两层神经网络可以学习谱表示,其中神经元收敛到不可约表示并实现旋转秩一对齐,为特征学习提供了表示论的解释。

0 人收藏 0 人点赞
#deep-learning-theory

神经网络可证明地学习群组合的谱表示

Hugging Face Daily Papers · 2026-06-02

本文提供了神经网络在群组合任务中学习结构化表示的理论分析,证明了训练动态驱动神经元以指数收敛速度收敛到不可约群表示。该工作建立了特征学习的表示理论解释,并刻画了矩阵值群表示的低秩压缩现象。

0 人收藏 0 人点赞
#deep-learning-theory

流形假设下可证明的扩散模型学习:坍缩与精炼

arXiv cs.LG · 2026-05-21 缓存

本文识别了流形假设下扩散模型中的坍缩与精炼机制,提出了分数诱导潜在扩散(SiLD),该方法可证明地避免了维度灾难。实验表明,SiLD在生成质量上匹配或超越基于VAE的潜在扩散模型。

0 人收藏 0 人点赞
#deep-learning-theory

通过误差控制动力学重新思考循环模型中的状态跟踪

Hugging Face Daily Papers · 2026-05-08 缓存

本文认为,循环模型中鲁棒的状态跟踪取决于误差控制动力学,而不仅仅取决于表达能力,证明了仿射循环网络会遭受累积误差的影响,从而限制了其有效视野。

0 人收藏 0 人点赞
#deep-learning-theory

广义神经元

ML at Berkeley · 2021-02-16 缓存

本文探讨了深度学习中的通用近似定理,分析了使用 ReLU 激活函数时单个神经元和神经网络层的表示能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈