@techNmak: 如今构建神经网络变得极其容易,以至于人们在完全不了解其工作原理的情况下也能完成。我们生活在一个以 'import torch' 为标志的时代……
摘要
作者批评了在使用 PyTorch 等高级库时缺乏对底层机制理解的现象,并推荐 Simon J.D. Prince 的笔记集合,以弥合语法应用与第一性原理工程实践之间的差距。
如今,在完全不了解神经网络工作原理的情况下构建它们变得极其容易,甚至充满危险。我们生活在一个“import torch”的时代。你可以用三行代码训练一个模型,但当你需要调试崩溃的损失函数或消失的梯度时,仅仅掌握语法是无济于事的。你需要掌握第一性原理。我最近学习了 Simon J.D. Prince 的这份笔记合集,它是摆脱“教程地狱”的良方。它不仅展示代码,还迫使你可视化其底层机制:
1./ 数学基础 => 在增加复杂性之前,它为浅层网络和区域建立直觉。
2./ 优化 => 它不仅仅是使用优化器,还比较了线搜索(Line Search)、随机梯度下降(SGD)和 Adam,让你理解它们为何表现不同。
3./ 现代技术栈 => 它将基础知识从基本的反向传播一直连接到自注意力机制(Self-Attention)和图神经网络(GNN)。
从运行代码转向系统工程 => 这是一座宝藏。
相似文章
@DivyanshT91162: 人们放弃机器学习的原因只有一个:打开一个笔记本……看到200行公式……突然觉得每个教程都像博士论文一样。
文章重点介绍了一个开源代码库,该代码库使用 Jupyter 笔记本从基本原理重新构建经典的机器学习算法,并提供逐步可视化,帮助学习者理解底层机制,而不仅仅是复制代码。
@DanKornas: 当你能逐单元格查看数学时,神经网络更容易理解。ai-by-hand-excel是一个Excel练习集合……
ai-by-hand-excel是一个开源的Excel工作簿集合,通过让用户逐单元格查看数学运算来教授神经网络、反向传播和transformers等AI概念,使模型内部机制更直观。
@DivyanshT91162: Andrej Karpathy 的整个声誉都建立在一个理念上:"只有当你从头开始构建它时,你才真正理解它…"
一条 Twitter 帖子讨论了 Andrej Karpathy 教学理念的讽刺之处——通过从头构建来学习——而现在他却在用 AI 编程,并分享了一段为期 3 周的学习历程,使用 Claude Opus 4.8 以老派方式掌握深度学习。
@Blum_OG: "每个人都在用AI,但几乎没人懂它的原理。" 这个差距是真实存在的——而这正是关键所在。以下就是……
一条解释AI工作原理的推文串,涵盖token、注意力机制、参数、上下文窗口、幻觉、RAG和RLHF,帮助用户成为更精明的AI使用者。
@jxmnop: https://x.com/jxmnop/status/2066668040557867368
一条推特讨论,为进行人工智能研究提供哲学和实践建议,强调阅读与实践相结合,深入理解基础而非追逐潮流,保持初学者心态,以及纪律和开放心态的重要性。