@rohanpaul_ai: 代理型AI可能正在迫使将更多关注CPU的传统计算堆栈重新回到故事的中心。这里,A…

X AI KOLs Following 新闻

摘要

本文讨论了代理型AI如何可能将计算焦点从GPU转回CPU,引用了OpenAI的CFO和Ark Invest的CEO。它认为代理的推理涉及编排和通用任务,CPU处理这些任务更擅长。

代理型AI可能正在迫使将更多关注CPU的传统计算堆栈重新回到故事的中心。 这里,Ark Invest的CEO兼CIO Cathie Wood引用了OpenAI的CFO Sarah Friar的话——"人们都在追逐GPU。他们将会对代理型AI如何激活CPU感到震惊。" 市场多年来一直将GPU视为稀缺资源,因为训练大型模型让并行计算看起来像是命运。 但代理型AI改变了瓶颈。 一个代理不仅仅向一个巨型模型询问一个答案;它会规划、调用工具、检查内存、检索文件、编写代码、查询数据库,并循环直到任务完成。 这意味着推理不仅仅是矩阵乘法。 它是编排、数据移动、网络、存储、调度以及许多CPU仍然比加速器处理得更好的通用工作。 ---- 来自"Bloomberg Podcasts" YT频道(链接在评论中)
查看原文
查看缓存全文

缓存时间: 2026/05/23 12:04

代理型人工智能可能正在迫使旧的以CPU为核心的计算栈重新成为焦点。

这是Ark Invest首席执行官兼首席投资官凯西·伍德引述OpenAI首席财务官莎拉·弗里尔的话——“人们正在争抢GPU。当代理型AI激活CPU时,他们将会非常震惊。”

市场多年来一直将GPU视为稀缺资源,因为训练大型模型让并行计算看起来是一种必然。

但代理型AI改变了瓶颈所在。

一个代理并不仅仅是向一个大模型问一个问题然后得到答案;它会规划、调用工具、检查记忆、检索文件、编写代码、查询数据库,并循环执行直到任务完成。

这意味着推理不仅仅是矩阵乘法。

它涉及编排、数据传输、网络、存储、调度以及大量通用计算工作——而这些工作,CPU仍然比加速器处理得更好。


来自“Bloomberg Podcasts“ YouTube频道(链接见评论)

相似文章

AI agents 正在改变人们对计算成本的看法

Reddit r/AI_Agents

本文讨论了AI代理工作流如何将优化重心从单纯的推理成本转向更广泛的挑战,如延迟、编排开销和可靠性。文章强调了向混合架构和动态模型路由发展的趋势,以应对这些多步骤工作流的复杂性。

AI 战争正从模型转向硬件,但我觉得讨论得远远不够

Reddit r/artificial

一篇评论文章认为,AI 竞争正从模型质量转向硬件部署与基础设施。文中指出,微软的 Project Solara、英伟达的 RTX Spark 以及字节跳动自研 CPU 等案例表明,智能体工作负载正推动着硅片与部署策略的革新。

AI经济学 第二部分(11分钟阅读)

TLDR AI

本文分析了AI的经济学,聚焦于GPU资源的争夺战,将人类推理的尖峰负载与智能体连续工作负载进行对比,并认为当前基础设施是为人类使用而优化的,而非要求更高的智能体推理。