AI正在扼杀廉价智能手机

Hacker News Top 新闻

摘要

文章认为,AI对内存的贪婪需求正推高智能手机的生产成本,终结了廉价手机时代,并将低收入消费者排挤出市场,尤其在非洲和中东地区。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/22 00:37

# AI 正在扼杀廉价智能手机 来源:https://davidoks.blog/p/ai-is-killing-the-cheap-smartphone [](https://substackcdn.com/image/fetch/$s_!5Z0b!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Ffb39b638-e59b-451f-af50-57065a9cbac5_800x533.jpeg) 过去几十年最引人注目的事情之一,就是电脑变得多么便宜。 1985年,如果你是一个相当富裕的美国人,你买得起的最好电脑是 IBM PC AT (https://en.wikipedia.org/wiki/IBM_Personal_Computer_AT)。PC AT 的花费大约是 6,000 美元——相当于 2026 年的 19,400 美元——因此占到了美国中位数年收入的四分之一左右;它运行在 Intel 80286 处理器上,每秒能执行大约 90 万条指令。而如今,如果你在内罗毕或拉各斯的一个市场摊位前,你可以找到一部廉价智能手机——比如中国传音制造的 Tecno Spark Go——价格在 30 到 120 美元之间。这部手机运行的处理器,能够每秒执行 **数十亿** 次计算。 换句话说:你现在可以花大约 40 年前最顶尖消费设备价格的 0.3% 左右,买到一台性能强大数千倍的电脑。历史上没有任何其他商品经历过如此规模的成本下降:穷人现在可以在口袋里装着一台电脑,其性能比几十年前全球最富有人群所能买得起的还要高出好几个数量级。消费电子产品的这种巨大降价,使得计算能力以前所未有的方式扩散到全球人口中,这堪称奇迹。由于像 Tecno Spark Go 这样的廉价智能手机,全球数亿最贫困的人口得以接入互联网。 那个时代现在正在走向终结。 2026年,追踪智能手机市场的国际数据公司 (IDC) 预测,全球智能手机出货量将下降 13% (https://finance.yahoo.com/news/largest-drop-ever-idc-predicts-011003421.html),这是有史以来最大的单年降幅。这场暴跌在非洲和中东最为严重,那里的智能手机出货量将下降超过 20%,并且集中体现在智能手机行业最廉价的一端。这一冲击代表的并非暂时性波动,而是 “整个市场的结构性重置” (https://www.reuters.com/business/media-telecom/smartphone-market-set-biggest-ever-decline-2026-memory-price-surge-idc-says-2026-02-26/):全球很大一部分人口正在因价格过高而被挤出智能手机拥有者的行列。 因此,过去几十年消费电子产品逐年变得更好、更便宜的趋势,正面临急剧逆转:贫困世界现在正进入一场智能手机危机。 这其中有一个简单的原因。 智能手机和其他电脑一样,需要使用内存:而全球内存的供应是极其缺乏弹性的,因为内存真的很难生产。很长一段时间里,大部分内存都被用于智能手机和笔记本电脑;但在过去几年里,AI 成为了一个巨大且利润丰厚的内存消费者。这导致了内存的大规模重新分配,从消费电子产品转向 AI。不可避免的结果是,现在制造智能手机的成本比几年前高得多。短期内,这意味着那些将计算和互联网接入传播到世界最贫困角落的廉价智能手机,已经消亡。 但照目前的发展速度来看,贫困世界似乎只是第一个被冲击的目标。如果 AI 的消耗量继续以当前速度增长——或者如果它加速增长,这显然是有可能的——那么智能手机危机很快就会蔓延到富裕世界。消费电子产品即将变得昂贵得多。 智能手机就是电脑。它们是 **非常小** 的电脑,并且还拥有触摸屏和无线电等部件。但就内部架构而言,智能手机本质上与你买到的笔记本电脑或服务器相同。它们有一个处理器来执行计算和运行逻辑,使设备按你的指令行事。它们有内存来保存处理器当前正在处理的数据。它们有存储空间,在设备关机后保留数据。它们还有一块电路板,将这些不同的部件连接在一起。 过去几十年计算领域的大故事是处理器。你可以把处理器想象成一个巨大的晶体管阵列——这些微小的开关通过开启和关闭来执行逻辑运算。我们在想办法让晶体管变得更小、更高效方面做得很好——非常出色——这意味着处理器在过去几十年里以指数级的速度进步。这就是摩尔定律。 但是,处理器只能处理它们能够访问的数据:而它们能够访问的数据来自内存:具体来说,在现代计算机中,来自 DRAM,即“动态随机存取内存”。在这方面,情况则大不相同。DRAM 确实进步了;但其进步速度远不及处理器:在 1980 年代和 1990 年代,处理器速度每年提升 60%,而 DRAM 速度每年仅提升 7% (https://acs.pub.ro/~cpop/SMPA/Computer%20Architecture%20A%20Quantitative%20Approach%20(5th%20edition).pdf) (https://acs.pub.ro/~cpop/SMPA/Computer%20Architecture%20A%20Quantitative%20Approach%20(5th%20edition).pdf) (https://acs.pub.ro/~cpop/SMPA/Computer%20Architecture%20A%20Quantitative%20Approach%20(5th%20edition).pdf)。 这意味着,在过去几十年里,计算机性能的主要瓶颈一直是内存。计算机科学家称之为 “内存墙” (http://svmoore.pbworks.com/w/file/fetch/59055930/p162-mckee.pdf)。过去几十年里,计算机架构领域的大量工作,都在寻找各种绕开处理器与 DRAM 之间鸿沟的方法。 那么,为什么 DRAM 没有像处理器那样快速进步呢? 简单来说:这本身就是个非常困难的难题。就像处理器是巨大的晶体管阵列一样,内存芯片基本上也是巨大的内存单元阵列:每个内存单元包含一个晶体管和一个称为电容器的存储单元,它负责保存对应单个数据位的电荷。我们知道如何缩小晶体管。但缩小电容器要困难得多。随着电容器变小,它可靠地存储电荷就变得更难:电荷可能会泄漏、消失,或者被来自邻近电容器的干扰所改变。所以,如果你想让 DRAM 更高效,就需要采用各种越来越另类的架构。 而这正是已经发生的情况。DRAM **需要** 变得更高效,才能跟上处理器的进步。因此,现代 DRAM 制造是一个极其复杂和昂贵的过程。建造一座最先进的 DRAM 制造工厂(晶圆厂)需要花费大约 150 到 200 亿美元;购置所有必要的设备,比如光刻工具和蚀刻机,还要再花几十亿美元;然后,你需要花几年时间生产不合格且有缺陷的内存芯片,直到你的良率开始具备竞争力。 这引出了制造 DRAM 的公司——即“内存制造商”——特有的经济学问题。 关于内存,除了它制造昂贵且困难之外,需要知道的最重要一点是,它是 **可互换的**。处理器是定制的:你不能把 Intel 芯片换成 Apple 芯片。但内存芯片 **不是** 定制的。DRAM 芯片都遵循相同的行业标准,所以一个内存制造商生产的芯片可以插入与另一个制造商芯片相同的设备中。换句话说,DRAM 是一种商品。 而这种组合——资本密集型制造加上可互换性——是一种惩罚性的组合。因为内存是可互换的,这个行业是极度周期性的:DRAM 行业的整个历史就是一部繁荣与萧条的超级周期史。首先,来自某个或某些领域的强劲需求——比如 1990 年代的 Windows PC 普及 (https://newsletter.semianalysis.com/p/memory-mania-how-a-once-in-four-decades) ——推动了价格飙升和所有参与者的一波投资浪潮;对无差异商品的累积过度投资导致了供应过剩;然后供应过剩又导致价格暴跌。 而且因为生产成本如此高昂,那些下行周期证明是致命的:内存行业的特点就是不断的毁灭。Intel 在 1970 年代早期主导了内存市场,但在 1980 年代退出,转而专注于处理器。德州仪器和 IBM 也曾是主要玩家,但都在 1990 年代退出。德国的 Qimonda (https://en.wikipedia.org/wiki/Qimonda) 在 2009 年倒闭;日本的尔必达 (Elpida) (https://www.nippon.com/en/currents/d00032/elpida-and-the-failure-of-japan-inc.html) —— 一度是世界第三大 DRAM 制造商——在 2012 年宣布破产。 几十年的崩溃和整合,只留下了少数玩家屹立不倒。在 1990 年代,全球可能有大约 20 家重要的 DRAM 生产商;今天,只有三家占据了全球 90% 以上的产量。韩国拥有两家,SK 海力士和三星;美国有一家,美光。 这些内存制造商从他们行业无情的过往中,学到了一个非常具体的教训:**永远让需求得不到满足**。在一个资本密集型和周期性的行业中生存的唯一方法,是展现出近乎超人类的资本纪律。需求现在可能会上升,但它总会下降。所以,与其冒着在需求必然放缓时被摧毁的风险去扩大生产,不如让价格飙升,看着边缘的存储器消费者被挤出市场。 事实证明,对于智能手机用户来说,这是一个残酷的计算。 早些时候,我说内存是“可互换的”。这需要做一个限定。内存在不同制造商之间是可互换的:三星的芯片可以插入与 SK 海力士芯片相同的设备中。但这并不意味着所有电脑都以相同的方式使用内存。我写这篇文章用的 MacBook Pro 需要足够快的内存来跟上同时运行多个程序的强大处理器:因此它使用一种称为 DDR 的标准,即“双倍数据速率”,它以相当高的电压运行并提供高带宽。我 iPhone 上的处理器性能较弱,所以在任何给定时刻需要的数据较少;但电压至关重要,因为分配给内存的每毫瓦电力都是从电池中消耗的。因此,智能手机使用 LPDDR,即“低功耗双倍数据速率”,这是一种为在较低电压下运行而设计的 DDR 变体。而在运行 Claude 和 ChatGPT 的数据中心,使用的是完全不同的标准:HBM,即“高带宽内存”,我稍后会再谈到。 这三种标准都使用相同的起始材料,以相同的方式制造。内存制造商收到称为晶圆的薄硅片;在几个月的时间里,他们蚀刻上数十亿个内存单元;然后将晶圆切割成单个芯片并出货。 因此,内存制造商面临的关键问题是,**如何将其晶圆产能分配给 DDR、LPDDR 和 HBM**。一部分晶圆分配通过长期协议锁定给主要买家,比如苹果或戴尔;另一部分则在现货市场上出售,卖给那些想要灵活性或缺乏达成长期协议规模的买家。所以每个季度,三星、SK 海力士和美光的晶圆分配团队都会根据价格、合同以及他们对未来需求方向的最佳判断,来决定如何将他们的晶圆分配到这三类产品中。 在行业历史的大部分时间里,这种分配是直截了当的。在 2010 年代末期,DDR、LPDDR 和 HBM 的利润率大致相似;内存制造商最关心的是数量,而晶圆分配基本上遵循终端市场的需求。手机是内存最大的单一市场,所以 LPDDR 获得了大部分晶圆。DDR 占据了其余的大部分。而 HBM 是为高性能计算客户提供的利基产品,所以只获得了很小的一部分。 这种情况随着 AI 的出现而发生了巨大改变。 训练和运行 AI 模型的计算强度极高。即使简单的查询也需要数十亿次的矩阵乘法,顺序和并行地反复进行。AI 工作负载需要能够同时进行海量运算的计算机——这就是为什么像 Nvidia GPU 和 Google TPU 这样的专用硬件变得如此重要。但是,由于 GPU 和 TPU 同时执行如此多的计算,它们需要以相应巨大的速率被提供数据。否则,昂贵的硬件就会闲置。换句话说,需要的是一种被设计用来以极高速度向多个处理器同时传送大量数据的内存。 这正是 HBM 的设计目标。 HBM 的核心思想很简单。你取许多 DRAM 裸片,将它们堆叠在一起,用数千个微小的垂直通道连接它们,以便许多数据路径可以并行运行,然后将整个堆栈紧贴在 GPU 或 TPU 旁边。实际上做到这一点非常困难。但如果成功了,你可以比使用 DDR 传输多一个数量级的数据。 HBM 的缺点,除了生产困难之外,还在于它极其消耗晶圆资源。不仅仅是因为你要把很多裸片堆叠在一起。由于所有外围电路和所有垂直通道,每 1 GB 的 HBM 消耗的晶圆产能,是 1 GB 的 DDR 或 LPDDR 的 **三倍多** (https://www.tomshardware.com/pc-components/gpus/micron-says-high-bandwidth-memory-is-sold-out-for-2024-and-most-of-2025-intense-demand-portends-potential-ai-gpu-production-bottleneck)。实际上,每生产 1 GB 的 HBM,就意味着少了 3 GB 的商品内存没有被生产出来。 很长一段时间里,这并不重要,因为 HBM 的需求很小。当 ChatGPT 在 2022 年 11 月发布时,内存制造商正处于需求低迷期,他们花了一些时间才意识到情况已经发生了变化。在 2023 年初,行业贸易媒体仍在观望,报道仅限于暗示 “AI 聊天机器人可能有助于缩短 DRAM 市场低迷期” (https://www.digitimes.com/news/a20230223PD215/chatgpt-memory-chips.html)。 但 HBM 需求的增长速度远快于内存制造商的预期。AI 的使用量持续爆炸式增长;并且随着使用量转向更密集的模型——从聊天机器人到长期运行的代理——很明显,对 HBM 的需求将比任何人最初预期的都要大得多。内存制造商措手不及。到 2024 年底,全面 HBM 短缺已经出现;到 2025 年,HBM 的利润率达到 70% 或更高,而 DDR 和 LPDDR 的利润率则在 20% 到 30% 之间。 对于内存制造商来说,理性的反应是显而易见的:**加大 HBM 的产量**。因此,他们重新分配了巨大的产能。2023 年,HBM 占内存制造商晶圆产能的 2% (https://www.trendforce.com/presscenter/news/20240506-12125.html);2024 年,5%;2025 年,10%;到 2026 年底,这一比例预计将达到 20% (https://www.trendforce.com/news/2025/12/26/news-ai-reportedly-to-consume-20-of-global-dram-wafer-capacity-in-2026-hbm-gddr7-lead-demand/),另外还有 3% 的产能分配给用于 AI 服务器的高密度 DDR。因此,在三年时间里,HBM 从一个外围产品类别变成了内存行业的核心。率先实现最先进 HBM 节点量产的 SK 海力士,仅在 2024 年 HBM 收入就增长了四倍 (https

相似文章

我想我本该去当水管工

Reddit r/AI_Agents

一篇观点文章认为,AI 不仅会取代软件工程师,最终也会取代所有熟练工种,包括水管工。计算机科学专业的学生应专注于培养解决问题的能力,而不是害怕自动化。

2022年前的书籍

Hacker News Top

一篇个人反思,讲述了为什么偏爱2022年前的书籍,因为那些书是在没有AI辅助的情况下创作的,并对LLM时代人类努力的价值提出了质疑。

Infosys/accenture

Reddit r/AI_Agents

一位2025年毕业、在四大咨询公司工作的员工表达了对AI和自主AI是炒作还是真正威胁就业的担忧,并寻求关于实际市场影响的务实建议。