@antoniolupetti:《神经网络数学》是一套优秀的讲义,适合任何希望从数学角度研究现代神经网络的人……
摘要
一套涵盖神经网络数学的讲义,从基本激活函数到群卷积和等变性等几何概念。
查看缓存全文
缓存时间: 2026/06/28 16:11
“神经网络的数学“是一套优秀的讲义笔记,适合任何希望从数学角度研究现代神经网络的人。
内容涵盖监督学习、人工神经元与激活函数(ReLU、sigmoid、tanh、swish、softmax)、浅层与深层神经网络、随机梯度下降、权重初始化、梯度消失与梯度爆炸、卷积神经网络、自动微分、反向传播、自适应优化算法(Adagrad、RMSProp、Adam),并以现代几何概念收尾,如流形、李群、等变性、群卷积,以及旋转平移等变CNN。
我建议你将其加入书签,作为探索神经网络背后数学原理时的实用参考。
https://arxiv.org/abs/2403.04807
神经网络的数学(研究生课程讲义)
来源:https://arxiv.org/abs/2403.04807 文献工具
文献与引用工具
文献浏览器 切换
代码、数据与媒体
本文相关的代码、数据与媒体
演示
演示
相关论文
推荐与搜索工具
IArxiv 推荐器 切换
关于 arXivLabs
arXivLabs:与社区合作者的实验性项目
arXivLabs 是一个框架,允许合作者直接在我们的网站上开发和分享新的 arXiv 功能。
与 arXivLabs 合作的个人和组织都已接受并认可我们的价值观:开放、社区、卓越以及用户数据隐私。arXiv 致力于这些价值观,并仅与遵守这些价值观的合作伙伴合作。
有一个能为 arXiv 社区增添价值的项目想法?了解更多关于 arXivLabs (https://info.arxiv.org/labs/index.html)。
相似文章
@antoniolupetti: “Matrix Calculus for Machine Learning and Beyond” 是一套有趣的免费讲义,用于理解矩阵…
一套免费的麻省理工学院讲义,关于机器学习的矩阵微积分,结合了严谨的数学与可视化解释。
@antoniolupetti: "计算神经网络梯度"是对反向传播和梯度计算背后数学的清晰介绍…
斯坦福CS224N课程笔记清晰地介绍了神经网络中反向传播和梯度计算的数学原理,涵盖链式法则、计算图和向量化导数。
@BetaTomorrow:该论文(《神经网络数学》,一套80页的数学讲义)提供了全局输入-输出……
文章批评当前的神经网络理论缺少一个控制方程,认为在学习、推理和收敛在数学上统一之前,AGI仍然是一种外推而非一个适定的科学对象。
@DiracGhost:无论是计算机科学家还是数学家,都会忍不住去看看这本极好的计算导论……
推荐一份由De Sterck和Ullrich编写、加州大学戴维斯分校公开提供的计算数学(数值分析)免费课堂笔记,内容涵盖误差传播、求根、插值、积分、傅里叶方法和数值线性代数。
@antoniolupetti: "Dive into Deep Learning" 是一本开源书籍,它构建了大型语言模型的数学基础,涵…
一本开源书籍,构建了大型语言模型的数学基础,涵盖线性代数、微积分、概率和Transformer架构,包含超过1000页的清晰解释和实用示例。