@karpathy: 大约一周前在红杉资本Ascent 2026上的炉边谈话。一些亮点:我试图强调的第一个主题是LLMs…

X AI KOLs 新闻

摘要

安德烈·卡帕西在红杉资本Ascent 2026上的谈话摘要,重点介绍了三个主题:LLMs在速度提升之外开拓的新领域(例如原生图像处理、.md脚本、非结构化知识库)、模型能力'参差不齐'背后的经济学,以及智能体原生经济的崛起。

大约一周前在红杉资本Ascent 2026上的炉边谈话。一些亮点:我试图强调的第一个主题是,LLMs远不止是加速已有的事(例如编程)。三个新领域的例子:1. menugen:一个可以被LLMs完全接管的应用,无需经典代码:输入图像,输出图像,LLM能够原生地完成这一任务。2. 安装.md技能而非安装.sh脚本。为什么要为安装一个软件创建一个复杂的Software 1.0 bash脚本,如果你可以用文字描述安装过程并说“把这个给你的LLM看”呢?LLM是一个高级的英语解释器,能够智能地针对你的环境进行安装,内联调试一切等等。3. LLM知识库,这是一个经典代码*不可能*实现的例子,因为它涉及对来自任意来源、任意格式的非结构化数据(知识)进行计算,包括纯文本文章等。我强调这些,是因为在每个新范式转变中,显而易见的事情总是关于加速或某种程度改进已有的事物,但这里我们有功能的例子,要么突然可能根本不应该存在(1,2),要么以前根本上不可能(3)。第二个(持续的)主题是试图解释LLMs能力参差不齐的模式。为什么一个单一的工件可以同时做到1) 连贯地重构一个10万行的代码库 *和* 2) 告诉你走路去洗车场洗车。我之前写过关于这个来源与领域的可验证性有关,现在我进一步扩展,认为这也与经济因素有关,因为收入/TAM决定了前沿实验室在强化学习过程中选择将哪些内容打包到训练数据分布中。要么你在数据分布中(在RL电路的轨道上)飞驰,要么你在丛林中用砍刀越野,相对而言。对此我仍不完全满意,但这是一个持续的挣扎,试图建立一个准确的LLM能力模型,以便在实际利用它们的力量的同时避免其陷阱,这引出了……最后一个主题:智能体原生经济。将产品和服务分解为传感器、执行器和逻辑(分布在1.0/2.0/3.0计算范式中),我们如何使信息对于LLMs最大化可读,关于快速兴起的智能体工程及其技能集的几点讨论,相关的招聘实践等,甚至可能包括完全神经计算处理绝大多数计算、同时由(经典)CPU协处理器辅助的暗示/梦想。
查看原文

相似文章

@runes_leo: Karpathy 4/30 在 Sequoia Ascent 把今年最有用的 AI 解释,压缩成三个论点。读完你看 AI 的方式会变。 1. AI 不只是"更快",是新范式 过去 2 年大家都在讲 AI 让事情变快。 Karpathy 说…

X AI KOLs Timeline

本文总结了Karpathy在Sequoia Ascent大会上的核心观点,指出AI是重塑任务流的新范式而非单纯加速工具,通过可验证性与经济价值划分了模型能力的“参差不齐边界”,并预言未来软件将演变为以LLM为逻辑层、传统代码为传感器/执行器的智能体原生架构。

安德烈·卡帕斯:从Vibe Coding到Agentic Engineering

YouTube AI Channels

安德烈·卡帕斯讨论了2024年12月LLM达到新可靠性水平的转变,提出了'vibe coding'用于提升下限,'agentic engineering'用于提升上限,并认为可验证性是AI参差不齐能力的关键。