@ericjang11: 在过去的几个月里,我一直在从零实现AlphaGo,这是2016年的一项AI突破,它启发了我……
摘要
Eric Jang发布了AutoGo,一个从零实现AlphaGo的教程,包含代码和一个可对弈的机器人,展示了前沿能力现在可以低成本复现。
查看缓存全文
缓存时间: 2026/05/15 21:07
过去几个月,我一直在从头实现 AlphaGo——这个2016年的AI突破曾激励我投身深度学习。我对AlphaGo的粗浅理解是“通过自我对弈训练、结合搜索增强的深度神经网络“,但我想通过亲手创建它来更深入地理解。前沿深度学习研究向来成本高昂,但任何特定能力都会迅速变得廉价。到2026年,你不再需要DeepMind的资源来训练强大的围棋AI——只需几千美元的租用算力,就能自己“随心编码“完成全部工作。能受邀与@dwarkesh_sp 在@dwarkeshpodcast 上共同讲授这一内容,我深感荣幸。我是AlphaGo与围棋的学徒而非大师,因此播客中所有事实性错误均由我承担。教程网页版:https://evjang.com/2026/04/28/autogo.html… 代码:https://github.com/ericjang/autogo 在此处对弈:https://autogo.evjang.com
AutoGo:教程
来源:https://evjang.com/2026/04/28/autogo.html AutoGo
请将设备旋转至横屏
本教程使用宽屏画布——需要横向空间。
相似文章
Building AlphaGo from scratch – Eric Jang
Eric Jang 从头重建了 AlphaGo 并详细解释了蒙特卡洛树搜索和深度学习在围棋中的应用,展示了当前低成本复现强力围棋AI的可行性。
@dwarkesh_sp: 与 @ericjang11 的新黑板讲座:他演示了如何用现代AI工具从头构建AlphaGo。一些…
Eric Jang的黑板讲座逐步讲解了如何使用现代AI工具从零构建AlphaGo,涵盖了强化学习、蒙特卡洛树搜索、自我对弈,并与LLM训练相联系,同时讨论了自动化AI研究。
太棒了。说真的,人们对这个平台很苛刻,但如果你小心选择关注的人,它就是一个持续的……
Eric Jang 宣布他一直在从头实现 AlphaGo,这个 2016 年的 AI 突破曾激励他进入深度学习领域。
@Michaelzsguo: 这是我最近看到的关于强化学习基础,以及它和现代 AI 关系的最好深度讨论之一。 Eric Jang 和 Dwarkesh 把一个看起来有点复古的练习,也就是用今天的工具重新构建 AlphaGo,变成了一堂非常清晰的大师课:为什么“搜索 +…
A detailed discussion on reinforcement learning and its connection to modern AI, using the reconstruction of AlphaGo with modern tools as a clear example of search and self-play. Key takeaways include neural network amortization of search, credit assignment challenges in LLMs vs AlphaGo, and implications for automated research.
从围棋到生物学及更远:AlphaGo 影响的十年
DeepMind 回顾 AlphaGo 诞生十周年,强调其在开启现代 AI 时代中的关键作用,以及它对科学研究和通用人工智能(AGI)探索的深远影响。