deep-learning-theory

#deep-learning-theory

稳定边缘选择性塑造数据分布上的学习

arXiv cs.LG ↗ · 2026-06-04 缓存

MIT研究人员表明，神经网络训练中的稳定边缘（EoS）不仅仅是一个全局优化现象，而是选择性地在训练分布的子集上重新分配学习，放大某些数据组的进展同时抑制其他组。他们识别出控制这种分配的两个关键条件：梯度与Hessian矩阵最大特征向量的对齐，以及持续非消失的梯度幅度。

0 人收藏 0 人点赞

#deep-learning-theory

arXiv cs.LG ↗ · 2026-06-03 缓存

本文从理论上证明，在群组合任务上训练的两层神经网络可以学习谱表示，其中神经元收敛到不可约表示并实现旋转秩一对齐，为特征学习提供了表示论的解释。

0 人收藏 0 人点赞

#deep-learning-theory

Hugging Face Daily Papers ↗ · 2026-06-02

本文提供了神经网络在群组合任务中学习结构化表示的理论分析，证明了训练动态驱动神经元以指数收敛速度收敛到不可约群表示。该工作建立了特征学习的表示理论解释，并刻画了矩阵值群表示的低秩压缩现象。

0 人收藏 0 人点赞

#deep-learning-theory

arXiv cs.LG ↗ · 2026-05-21 缓存

本文识别了流形假设下扩散模型中的坍缩与精炼机制，提出了分数诱导潜在扩散（SiLD），该方法可证明地避免了维度灾难。实验表明，SiLD在生成质量上匹配或超越基于VAE的潜在扩散模型。

0 人收藏 0 人点赞

#deep-learning-theory

Hugging Face Daily Papers ↗ · 2026-05-08 缓存

本文认为，循环模型中鲁棒的状态跟踪取决于误差控制动力学，而不仅仅取决于表达能力，证明了仿射循环网络会遭受累积误差的影响，从而限制了其有效视野。

0 人收藏 0 人点赞

#deep-learning-theory

ML at Berkeley ↗ · 2021-02-16 缓存

本文探讨了深度学习中的通用近似定理，分析了使用 ReLU 激活函数时单个神经元和神经网络层的表示能力。

0 人收藏 0 人点赞