这家芯片初创公司刚融资1.35亿美元,押注AI的最大瓶颈不是计算,而是内存
摘要
XCENA,一家由三星和SK海力士资深人士创立的芯片初创公司,融资1.35亿美元,用于开发一种以内存为核心的芯片,该芯片可在DRAM附近处理AI推理任务,从而减少CPU与GPU之间昂贵的数据传输。该公司的MX1芯片有望提高效率并降低基础设施成本。
韩国芯片初创公司XCENA认为,AI真正的瓶颈不是计算,而是内存。
查看缓存全文
缓存时间: 2026/05/29 15:40
# 这家芯片初创公司刚刚融资1.35亿美元,押注AI的最大瓶颈不是算力,而是内存 | TechCrunch
来源:https://techcrunch.com/2026/05/29/xcena-secures-135m-at-570m-valuation-betting-on-memory-as-ais-real-bottleneck/
每次你向ChatGPT提问,你的请求都会触发一场数据接力赛:信息从内存出发,经过CPU预处理,再到GPU进行繁重计算,然后返回——而AI生成的每一个单词,都要重复这一整套旅程。
这个瓶颈是结构性的——这意味着每一次请求都要在业内最昂贵、功耗最高的芯片之间来回传输。而XCENA(https://xcena.com/)这家在韩国和美国都设有办公室的初创公司,正是试图解决这一问题的。这家成立四年的公司设计了一款芯片,将计算能力大幅靠近DRAM(即处理器正在使用的快速短期内存芯片),使得常规的数据操作可以在内存附近完成,无需在CPU、GPU和内存之间进行昂贵的往返传输。
如果这项技术能规模化应用,AI基础设施的成本可能会大幅降低——这也在很大程度上解释了投资者对这家公司的热情。实际上,XCENA刚刚完成了1.35亿美元的B轮融资,估值达到5.7亿美元,使其累计融资额达到1.85亿美元。
XCENA的CEO Jin Kim与CTO Dohun Kim、CPO Harry Juhyun Kim于2022年共同创立了这家公司,三人均来自三星和SK海力士这两家为英伟达GPU供应芯片的内存巨头。Jin Kim在接受TechCrunch采访时表示:"几十年来,CPU和GPU都变得越来越智能,但内存从未改变。XCENA想要改变这一点。"他还补充道:"近期内存价格和相关股票上涨,表明AI基础设施正在向以内存为中心的架构转变。"(本月,全球内存芯片市场三大主导者——三星、SK海力士和美光——首次同时突破万亿美元市值。)
Kim表示,XCENA的商业逻辑基于这样一个论点:"推理不仅仅是计算问题,它越来越多地是个内存扩展问题。"
XCENA的芯片MX1通过CXL(Compute Express Link,计算快速链接)连接到CPU——本质上是处理器和内存之间的一条专用快车道——在数据离开内存模块之前就对其进行处理。它让计算靠近数据,而不是反过来。该公司声称,以前需要10台服务器才能完成的任务,现在可能只需一台即可运行。
Kim说:"虽然GPU擅长矩阵乘法——即AI模型训练背后的繁重数学运算——但周围大量的数据编排工作,包括预处理、KV缓存管理(存储先前对话上下文以避免模型重复处理)和数据缓存,仍然在CPU上运行。我们的芯片直接在内存模块内部处理这些任务。"
自去年下半年以来,对内存解决方案的需求激增,公司认为时机正好对其有利。
与几家全球内存供应商的对话尚处于早期阶段,但Kim拒绝透露具体名称。公司最理想的客户是每年在AI基础设施上花费数百亿美元的超大规模云服务商——对他们来说,哪怕内存效率的小幅提升,也能节省数亿美元。
MX1目前仍是原型产品。量产芯片计划于2026年底从三星的代工线上下线,公司预计从2027年开始产生收入。
虽然神经处理单元(NPU)制造商正竞相挑战英伟达在训练任务上的地位,但XCENA瞄准的是支撑这一切的内存密集型层。
XCENA最接近的竞争对手包括Astera Labs和Marvell,这两家都是纳斯达克上市公司,专注于下一代内存连接技术。Kim表示,Marvell是一家已经在此领域布局的大型成熟企业,而差异化在于知识产权。"我们有数千个核心,"Kim说。根据公开规格,Marvell的方法依赖于少数几个通用核心作为对比。
这些核心基于RISC-V(一种开源芯片设计蓝图)构建,并专门针对数据处理进行了优化,每个核心都刻意设计得小而高效。除了核心本身,XCENA还自行设计内部内存层级、互连总线和DRAM控制器——这种垂直整合的程度,大多数芯片公司(包括规模更大的竞争对手)通常会外包。
总部位于首尔的VC公司Atinum和IMM Investment,与Corstone Asia以及现有投资者SBI Investment和Mirae Asset Capital共同领投了这轮B轮融资。这家公司在京畿道板桥(首尔外的科技中心)和桑尼韦尔均设有办公室,员工超过90人,目前也正在与多家国际投资者商讨额外融资事宜。
*当您通过我们文章中的链接购买商品时,我们可能会获得少量佣金(https://techcrunch.com/techcrunch-affiliate-monetization-standards/)。这不会影响我们的编辑独立性。*
Kate Park是TechCrunch的记者,专注于亚洲的科技、初创企业和风险投资。她此前是Mergermarket的金融记者,报道并购、私募股权和风险投资。
查看个人简介(https://techcrunch.com/author/kate-park/)
相似文章
内存成本已占AI芯片组件成本的近三分之二
根据Epoch AI分析,在2024年至2025年间,受HBM支出驱动,内存成本已升至AI芯片组件成本的63%。同期,AI芯片组件总支出从220亿美元增长至520亿美元。
SK hynix 开始为 NVIDIA AI 服务器量产 192GB SOCAMM2
SK hynix 已开始量产专为 NVIDIA AI 服务器优化的 192GB SOCAMM2 内存模块,与传统 RDIMM 相比,带宽提升一倍以上,能效提升 75%,解决了 AI 训练工作负载中的内存带宽瓶颈。
三星和SK加入OpenAI的Stargate计划以推进全球AI基础设施
三星、SK和OpenAI宣布战略合作伙伴关系,作为OpenAI Stargate计划的一部分。三星和SK将把先进内存芯片产能扩大到每月90万片DRAM晶圆,并在韩国探索AI数据中心开发,以支持全球AI基础设施建设。
AMD的小型AI PC预示着模型推理向本地化未来的转变
AMD的Ryzen AI Max平台配备128GB统一内存,可本地推理高达2000亿参数的大模型,旨在将AI工作负载从云端转移到紧凑的个人硬件上。
一家小型公司抢了AMD的风头,凭借采用老旧DDR4和28nm芯片的PCIe AI加速器,以仅240W功耗在本地运行700B参数大模型,向Nvidia发起挑战
台湾初创公司Skymizer发布了HTX301,这是一款PCIe AI加速器,采用较老的28nm芯片和DDR内存,仅需240W功耗即可在本地运行700B参数的大语言模型,对Nvidia和AMD的高功耗GPU解决方案构成挑战。