@chengyenhsieh: 如何获得前沿实验室的工作机会 我从Gemini预训练领域负责人那里找到了一篇好文章,尤其适合那些……
摘要
一条推文分享了在顶尖AI实验室找工作的职业建议,推荐了内核工作(例如FlashAttention、量化)和智能体研究方面的技能,并重点介绍了关于2位LLM量化的QuIP论文。
查看缓存全文
缓存时间: 2026/05/20 10:29
如何获取前沿实验室工作
我从 Gemini 预训练领域负责人那里读到一篇很棒的文章,尤其适合那些希望在前沿“新实验室”工作的人。
展示实验室所需的技能:
Vlad 建议专注于前沿实验室扩展其范围的方向。
这包括(但不限于)LLM 下方和上方的两个技术栈:
- 内核工作:涵盖用于提升 LLM 性能的生态系统。例如 DSL、FlashAttention、量化等。
- 智能体工作:精心设计的 LLM 工作流,用于创建有用的输出,例如 AutoResearch。
推荐的学习资源:
内核工作:
- Flash Attention 系列(第 1 至第 4 部分)
- DSL(领域特定语言):ThunderKittens 和 CuTe DSL
- SnapKV:推荐阅读以理解解码侧的优化。
量化
- LLM.int8():一篇经典的基础论文,可学到量化的强力技巧。
- Chris De Sa 团队的论文,特别是 QuiP、QuiP# 和 QTIP (https://arxiv.org/abs/2307.13304)
- AQLM: (https://arxiv.org/abs/2401.06118)。
智能体研究
Andrej Karpathy 的“AutoResearch” (https://github.com/karpathy/autoresearch…)
AlphaEvolve & FunSearch: (https://arxiv.org/abs/2506.13131)
QuIP: 具有保证的大语言模型 2 位量化
来源:https://arxiv.org/abs/2307.13304
查看 PDF (https://arxiv.org/pdf/2307.13304)
摘要:本文研究了大语言模型 (LLM) 中的后训练参数量化。我们引入了具有非一致性处理的量化 (QuIP),这是一种基于以下洞察的新方法:量化受益于 \textit{非一致} 的权重和 Hessian 矩阵,即权重幅度均匀且需要精确舍入的重要方向与坐标轴不对齐。QuIP 包含两个步骤:(1) 一个最小化二次代理目标的自适应舍入过程;(2) 高效的预处理和后处理,通过乘以随机正交矩阵确保权重和 Hessian 的非一致性。我们为第一个 LLM 规模的量化算法提供了理论分析来补充 QuIP,并证明我们的理论也适用于现有方法 OPTQ。实验上,我们发现我们的非一致性预处理改进了几种现有的量化算法,并产生了首批仅使用每权重两位就能得出可行结果的 LLM 量化方法。我们的代码可在此 https URL (https://github.com/Cornell-RelaxML/QuIP) 找到。
提交历史
来自:Jerry Chee [查看邮件 (https://arxiv.org/show-email/1ca36e91/2307.13304)] [[v1]](https://arxiv.org/abs/2307.13304v1) 2023 年 7 月 25 日星期二 07:44:06 UTC(87 KB) [v2] 2024 年 1 月 15 日星期一 21:54:28 UTC(108 KB)
相似文章
@eng_khairallah1: 埃里克·施密特(前谷歌CEO):'如果你真的想赚钱,其实很简单。创立一家智能体AI公司。' 如果我……
由@eng_khairallah1发布的一条推文合集,汇总了关于构建智能体AI公司的资源,包括Claude Code教程、LangChain近期产品公告(Interrupt、Labs、Engine、SmithDB)以及教育提示词。
@simpreetkaur_19: AI工程师面试必读论文:1. Attention is all you need(Transformers)2. LoRA(低秩…
为面试准备的精选AI基础论文清单,涵盖Transformer、高效微调、视觉模型与生成网络。
@GoSailGlobal: Nathan Lambert 跑遍了中国所有头部 AI lab Moonshot Zhipu Meituan Xiaomi Qwen / Ant Ling http://01.AI 回来写了一篇 Notes from inside Chi…
Nathan Lambert shares observations from visiting top Chinese AI labs, highlighting cultural differences in research focus and ego compared to US counterparts, while noting parity in hardware and model capabilities.
想获得AI工作?试试读康德
哲学家正越来越多地被顶尖AI实验室(如DeepMind和Anthropic)雇佣,以解决伦理和对齐问题,同时AI也在重塑大学的哲学课程。
@ycombinator:General Instinct (@gen_instinct) 将前沿AI模型部署到受限边缘硬件上,助力机器人技术和物理…
General Instinct 推出一个部署层,使前沿AI模型能够在如 Jetson 和移动 NPU 等受限边缘硬件上运行,帮助机器人技术和物理AI团队实现低延迟离线推理。