@BetaTomorrow:该论文(《神经网络数学》,一套80页的数学讲义)提供了全局输入-输出……
摘要
文章批评当前的神经网络理论缺少一个控制方程,认为在学习、推理和收敛在数学上统一之前,AGI仍然是一种外推而非一个适定的科学对象。
查看缓存全文
缓存时间: 2026/06/28 08:04
这篇论文(《神经网络数学》,一套80页的数学讲义)为前馈网络提供了全局的输入–输出表达式,但并未给出全局的神经网络方程。
当我们仍然没有神经网络自身的统御方程时,如何能自信地谈论AGI或《神经网络数学》?层组成不是统御方程,损失最小化也不是。
除非学习、推理、边界条件、迭代和收敛在数学上统一,AGI仍更像是基于观察能力的推断,而非一个适定的科学对象。
神经网络数学(研究生课程讲义)
来源:https://arxiv.org/abs/2403.04807 文献工具
文献与引用工具
文献探索器 切换
代码、数据与媒体
本文相关的代码、数据与媒体
演示
演示
相关论文
推荐与搜索工具
IArxiv 推荐器 切换
关于 arXivLabs
arXivLabs:与社区合作者的实验项目
arXivLabs 是一个框架,允许合作者直接在 arXiv 网站上开发和分享新功能。
与 arXivLabs 合作的个人和组织都认同并接受了我们的价值观:开放、社区、卓越和用户数据隐私。arXiv 致力于这些价值观,只与遵守这些价值观的伙伴合作。
有一个能为 arXiv 社区增值的项目想法?了解更多关于 arXivLabs (https://info.arxiv.org/labs/index.html)。
相似文章
@antoniolupetti:《神经网络数学》是一套优秀的讲义,适合任何希望从数学角度研究现代神经网络的人……
一套涵盖神经网络数学的讲义,从基本激活函数到群卷积和等变性等几何概念。
@BetaTomorrow: 论文:拓扑神经算子 作者:Lennart Bastian(@lennart_bastian), Tolga Birdal(@tolga_birdal), Samuel Lev…
本文介绍了拓扑神经算子,它将神经算子从纯点域提升到胞腔复形,嵌入几何与拓扑以减轻学习负担。研究表明,当几何不再被事后处理时,算子学习有所改善,尽管拓扑仍然是指定的。
@k_solidified_: https://arxiv.org/abs/2106.10165 全人类都该读一读
这本书为深度神经网络建立了一套有效理论,表明其预测近似高斯分布,且由深度与宽度的比值主导;并引入了表示群流(representation group flow)来分析信号传播和学习动力学。
@antoniolupetti: "计算神经网络梯度"是对反向传播和梯度计算背后数学的清晰介绍…
斯坦福CS224N课程笔记清晰地介绍了神经网络中反向传播和梯度计算的数学原理,涵盖链式法则、计算图和向量化导数。
人工神经网络如何运作——GPT IMAGE 2
简要评论指出,这张由GPT IMAGE 2图解的人工神经网络运作说明虽不完美,却依然令人印象深刻。