@SabrinaHalper: .@dwarkesh_sp 与 @ericjang11 的节目非常精彩。Eric 有一种罕见的才能,能把复杂的概念讲得简单易懂,…
摘要
Sabrina Halper 推荐 Dwarkesh Patel 与 Eric Jang 的播客,其中讨论了深度学习进展更多是受计算驱动,而非生物启发。
查看缓存全文
缓存时间: 2026/05/20 04:25
.@dwarkesh_sp 与 @ericjang11 的对谈节目非常精彩。Eric 有一种罕见的才能,能把复杂的概念讲得简单易懂——这正是我第一次在晚宴上见到他时立刻追着问问题的原因。
如果你想了解更多他的见解,可以听听我们几年前的那场对话!
「神经网络的历史,以及 AI 领域许多事物的灵感,很大程度上都来自生物学,比如遗传算法、进化算法,以及神经科学、心理学、生物学中的各种过程等等。我认为从自然界汲取灵感是很好的方式……但接下来这番话可能会招来科学界的批评——我觉得在过去大约十五年的深度学习进展中,绝大多数重大贡献来自那些并不怎么遵循这种思维方式的人。他们更多在想:『我怎样才能尽可能快地把更多数据塞进 GPU?』
根据经验来看,那些过于执着于复制某种自然启发式架构、而牺牲了暴力计算能力的人……往往做不出最好的算法。有一篇 @sarahookr 写的文章叫《硬件彩票》,其中指出,那些专注于最大化算法、让它适配硬件以便尽可能快地运行暴力计算的人,通常赢了。」
Dwarkesh Patel (@dwarkesh_sp):
最新黑板讲座,与 @ericjang11 合作
他一步步讲解了如何从零构建 AlphaGo,但用的是现代 AI 工具。
有时候,向后看反而能让你更好地理解未来。AlphaGo 仍然是展示智能两大原语——搜索与学习——最清晰的工作案例。
相似文章
@dwarkesh_sp: 与 @ericjang11 的新黑板讲座:他演示了如何用现代AI工具从头构建AlphaGo。一些…
Eric Jang的黑板讲座逐步讲解了如何使用现代AI工具从零构建AlphaGo,涵盖了强化学习、蒙特卡洛树搜索、自我对弈,并与LLM训练相联系,同时讨论了自动化AI研究。
@AnjneyMidha:*新讲座* 斯坦福 @CS153Systems '26,第八讲:智能背后的计算,与来自 @nvidia 的黄仁勋共同呈现
斯坦福 CS153Systems 课程讲座,由英伟达的黄仁勋主讲,探讨智能背后的计算。
@swyx: 这个播客是给社区的一份不可思议的礼物:不仅是我们第一个关于 @xAI 的播客,而且 Ethan 真的尽情回答了所有问题…
一条推文称赞了一期播客,前xAI世界模型负责人Ethan He深入分享了训练SOTA视频生成世界模型的见解,涵盖了Grok Imagine、Cosmos,以及视频与编码代理之间的相似之处。
@harshbhatt7585: https://x.com/harshbhatt7585/status/2063593933314113587
作者分享了从头训练一个160M参数大语言模型的经验,尝试了多种架构,如多Token预测和分层推理模型。他强调快速迭代、简化思路以及理解架构有效原因的重要性。
太棒了。说真的,人们对这个平台很苛刻,但如果你小心选择关注的人,它就是一个持续的……
Eric Jang 宣布他一直在从头实现 AlphaGo,这个 2016 年的 AI 突破曾激励他进入深度学习领域。