@ryanlpeterman: Vlad Feinberg (@FeinbergVlad) 是 Google DeepMind 的预训练领域负责人,我向他请教了如何在前沿 AI 实验室找到工作……

X AI KOLs Timeline 新闻

摘要

采访 Google DeepMind 预训练领域负责人 Vlad Feinberg,探讨如何在前沿 AI 实验室(如 Google DeepMind、Anthropic 或 OpenAI)找到工作,涵盖所需技能、研究 vs 工程的区别以及扩展定律。

Vlad Feinberg (@FeinbergVlad) 是 Google DeepMind 的预训练领域负责人,我向他请教了如何在前沿实验室(如 Google DeepMind、Anthropic 或 OpenAI)找到工作。 本期内容: • 前沿实验室所需的技能 • 软件工程与 AI 研究的区别 • 对前沿研究至关重要的领域 • 工程师可以采取的具体步骤以更接近研究 • Jeff Dean 的现场奖金故事 观看渠道: • YouTube - https://youtu.be/cDyi91onoJ8 • Spotify - https://open.spotify.com/episode/5XgGwEsWKDKmXsXErgCf74?si=GorGk0nzQFqBnBFq7UM7KQ… • Apple Podcasts - https://podcasts.apple.com/us/podcast/the-peterman-pod/id1777363835… • 文本转录 - https://developing.dev/p/google-deepmind-pre-training-lead… 感谢本期节目赞助商对我工作的支持: • WorkOS:通过易于使用的 API,只需几行代码即可为您的应用添加 SSO、SCIM、RBAC 等功能,助您快速实现企业级就绪,请访问 https://workos.com 章节: 00:00 - 开场 00:33 - 前沿实验室所需的技能 08:45 - AI 研究与工程的区别 21:41 - 对前沿重要的领域 30:50 - 如何向前沿实验室推销自己 35:13 - 工程师可采取的具体步骤 38:29 - 预训练领域概述 47:23 - Jeff Dean 的现场奖金故事 50:14 - 最喜欢的 Gemini 战事故事 58:59 - 给年轻时的自己的建议 01:03:07 - 尾声
查看原文
查看缓存全文

缓存时间: 2026/06/15 23:11

Vlad Feinberg (@FeinbergVlad) 是谷歌DeepMind的预训练领域负责人,我就如何在一家前沿实验室(如谷歌DeepMind、Anthropic或OpenAI)找到工作向他请教了所有相关问题。

在本期节目中:

• 前沿实验室需要的技能 • 软件工程与AI研究的区别 • 对前沿研究至关重要的领域 • 工程师可采取的具体步骤以更接近研究 • Jeff Dean现场奖金故事

观看渠道:

• YouTube - https://youtu.be/cDyi91onoJ8 • Spotify - https://open.spotify.com/episode/5XgGwEsWKDKmXsXErgCf74?si=GorGk0nzQFqBnBFq7UM7KQ… • Apple Podcasts - https://podcasts.apple.com/us/podcast/the-peterman-pod/id1777363835… • 文字稿 - https://developing.dev/p/google-deepmind-pre-training-lead…

感谢本期节目的赞助商支持我的工作:

• WorkOS:只需几行代码即可通过易用的API添加SSO、SCIM、RBAC等功能,让您的应用达到企业级就绪状态,详情请访问 https://workos.com

章节:

00:00 - 开场 00:33 - 前沿实验室需要的技能 08:45 - AI研究与工程之间的区别 21:41 - 对前沿至关重要的领域 30:50 - 如何向前沿实验室推销自己 35:13 - 工程师可采取的具体步骤 38:29 - 预训练领域概览 47:23 - Jeff Dean现场奖金故事 50:14 - 最喜欢的Gemini实战故事 58:59 - 给年轻自己的建议 01:03:07 - 尾声


一句话总结

Google DeepMind预训练负责人Vlad Feinberg详解在顶级AI实验室找工作的核心技能:底层工程(内核开发以加速LLM)、研究品味(如何在随机性中做出决策)以及对缩放定律的深刻理解。


实验室最渴求的技能:内核开发与底层工程

Vlad指出,目前顶级实验室最普遍且旺盛的需求是内核开发和底层工程,目标是实际加速LLM的运行。 无论是在架构创新、优化推理服务(如改进KV缓存),还是跨越整个技术栈的改动,最终都需要以高吞吐量、低延迟的方式交付可运行的软件。这与经典后端工程思维紧密相关,是一个非常适合深耕的开放领域。

研究 vs. 应用:并非泾渭分明

针对DeepMind内部的分工,Vlad解释虽然存在预训练、后训练等纯研究团队(负责制作前沿模型配方并确保训练稳定),以及围绕Gemini的产品应用团队(如优化搜索结果),但二者无法完全切割。 例如,在提升LLM事实准确性、评估来源时,同样包含大量硬核研究工作。他提出了一个**“研究-应用光谱”**——当今的AI从业者必须能够在该光谱上灵活移动。

软件工程 vs. AI研究者:关键差异

Vlad以蒸馏技术为例说明底层工程的重要性: 蒸馏涉及从万亿token规模的巨型LLM中提取统计信息,并传递给学生模型。为了高效处理这种数百万美元级别的计算投入,团队经历了三到四代蒸馏基础设施的重构,每次花四个月重新思考系统设计(抽象、存储、跨数据中心读写)。正是这些“经典软件工程”投资,才带来了对蒸馏缩放定律的新理解和像Flash 3.0这样的成果。

那么,一个纯后端工程师直接转到研究团队会面临哪些困难?

  1. 缺乏文献背景:不熟悉领域已有的前沿工作,无法有效追溯高价值论文。
  2. 思维模式不同:软件工程的任务依赖图(DAG)是确定性的(修服务A → 修服务B → 单调进展);而研究DAG是随机的,某些节点可能成功也可能失败,需要探索。
  3. 无法提前“设计”最短路径:你需要培养研究品味——一种凭直觉估算某个方法成功率与时间投入的能力。

研究品味 = 正确遍历随机MDP

Vlad引用Jacob Steinhart的框架:研究即马尔可夫决策过程(MDP)

  • 研究项目中的里程碑构成随机依赖图,成功节点会开辟新可能性。
  • 软件工程可以写出所有路径并选最短;但研究需要事先估计不同想法的“成功率”和“时间投入”,然后决定下一步。
  • 这种“尚未开始就能判断概率”的能力,正是人们常说的研究品味,也是读博过程中培养的核心技能。

缩放定律:LLM研究的基石

针对预训练,Vlad强调理解缩放定律至关重要。

  • 关键不是函数形式(幂律、指数),而是能够预测特定扩展方案下的测试损失
  • 与ImageNet不同,LLM的每次预训练都是一次性的——你永远看不到完整的训练数据集。
  • 你不能只在MNIST或CIFAR上有效,然后直接搬到ImageNet级别。许多方法跨尺度会失效。
  • 因此,团队需要提出配方:一个将计算量映射到训练流程的函数,同时结合准确的预测规则,从而指导大规模扩展开箱。

来源

视频链接:https://www.youtube.com/watch?v=cDyi91onoJ8&feature=youtu.be

Vlad Feinberg@FeinbergVlad·5月18日: 如何在前沿实验室找到工作

https://vladfeinberg.com/2026/05/10/how-to-land-a-job-at-a-frontier-lab.html…

相似文章