Furiosa AI 向消费市场出售推理芯片将对本地大语言模型产生颠覆性影响
摘要
FuriosaAI 的 RNGD AI 芯片被 LG AI 研究院用于其 EXAONE 平台,提供 2.25 倍的推理性能提升和更优的能效,这标志着罕见的大型企业认可了英伟达的竞争对手。
这是一家专注于推理芯片的韩国初创公司:https://furiosa.ai/renegade-spec 台积电5nm工艺,Hynix HBM3 1.5TB/s,48GB显存,TDP 180W。已在LG大语言模型上测试。如果他们像NVIDIA开放PTX和Intel开放SPIR-V那样开放编程接口,并与llama.cpp合作实现GGML后端,那将是一个颠覆性的改变。Rtx pro 5000 48GB(非HBM)现在售价$5000。AMD的r9700 32GB售价$1300,Intel B70 32GB售价$1000。我敢打赌,如果他们的RNGD芯片定价合理——凭借其内存带宽、显存和TDP——按照这个趋势,他们将会创下销售记录。如果定价$2500一张卡,我肯定会毫不犹豫买一张,前提是它能像AMD上的Vulkan一样流畅运行llama.cpp。甚至,即使它运行得像Intel B70 SYCL后端那样,只能达到理论TG速度的40%,我也会买。那仍然比AMD的Vulkan TG要好。编辑:他们目前不向消费市场出售。我希望他们能这样做,因为这对本地大语言模型来说将是颠覆性的。
查看缓存全文
缓存时间: 2026/06/10 00:22
# 不是卖给Meta,AI芯片初创公司FuriosaAI签下大客户 | TechCrunch
来源:https://techcrunch.com/2025/07/21/instead-of-selling-to-meta-ai-chip-startup-furiosaai-signed-a-huge-customer/
周二,韩国AI芯片初创公司FuriosaAI(https://furiosa.ai/)宣布达成合作,将向使用LG AI Research(https://www.lgresearch.ai/)旗下最新EXAONE平台的企业供应其AI芯片RNGD(https://furiosa.ai/rngd)。
RNGD针对大语言模型(LLM)运行进行了优化,而就在上周,韩国科技巨头LG发布了(https://www.lgresearch.ai/exaone)其下一代混合AI模型EXAONE 4.0(https://huggingface.co/LGAI-EXAONE)。此次合作瞄准电子、金融、电信和生物技术等关键领域的多样化应用。
这一消息大约出现在FuriosaAI拒绝Meta 8亿美元收购要约(https://techcrunch.com/2025/03/24/ai-chip-startup-furiosaai-reportedly-turns-down-800m-acquisition-offer-from-meta/)三个月之后,该公司选择保持独立。
据当地媒体报道,FuriosaAI拒绝该交易是因为对收购后的业务战略和组织架构存在分歧,而非价格问题。Meta对收购FuriosaAI等AI芯片制造商的兴趣,反映了其减少对英伟达等第三方供应商依赖的更广泛战略。
当被问及与Meta的交易为何告吹时,FuriosaAI首席执行官白俊(June Paik)对TechCrunch表示:“我们希望继续自己的使命,同时我认为这也是一个激动人心的机会。我相信,无论是个人还是公司,让AI计算更具可持续性都是一项非常有影响力的贡献。”
既然并购(至少来自Meta的)已不可能,白俊拒绝说明该初创公司目前是否在寻求新一轮融资。
**图片来源:** FuriosaAI
但白俊表示,这一新合作伙伴关系将带来远超韩国本土的商业机会。
白俊说:“LG AI的EXAONE被视为韩国领先的主权AI模型。它不会仅仅用于LG内部,将成为韩国AI生态系统中的主要AI模型之一。我们预计,无论是对EXAONE还是对我们的芯片解决方案,韩国国内都会有很多需求,但不仅仅局限于韩国。LG团队也在与全球客户合作并开展业务。因此,我们也期望这些客户(包括全球客户)能够使用我们的解决方案。”
LG AI决定采用Furiosa的AI芯片和加速器还有另一个重要原因:白俊表示,这是大型企业为数不多的公开认可英伟达竞争对手的举动之一。胜出的一个重要因素是该初创公司的硬件成本更低。
白俊说:“我们必须证明我们的解决方案不仅能提供强劲性能,还能降低总拥有成本。”
FuriosaAI声称,其RNGD加速器在与LG AI Research的EXAONE模型配合使用时,性能优于竞品GPU,推理性能提升了2.25倍。白俊还表示,LG发现FuriosaAI硬件的能效更高。
Furiosa的芯片并非通用GPU,而是专为AI打造。白俊说:“我们可以高效支持各种AI模型。但与本质上仍是通用处理器的GPU不同,我们的架构原生为AI计算构建。我们不开发用于渲染或挖矿的芯片。”
白俊表示,LG AI Research两年前就开始评估FuriosaAI的RNGD加速器,旨在测试其效率,并确定是否能够将其集成到LG生态系统中的EXAONE驱动服务中。
这家总部位于首尔的初创公司还在圣克拉拉设有办事处,全球团队仅有15名员工。
*当您通过我们文章中的链接购买产品时,我们可能会获得少量佣金(https://techcrunch.com/techcrunch-affiliate-monetization-standards/)。这不会影响我们的编辑独立性。*
Kate Park是TechCrunch记者,专注亚洲科技、初创企业和风险投资。她此前曾在Mergermarket担任财经记者,报道并购、私募股权和风险投资。
查看作者简介(https://techcrunch.com/author/kate-park/)
相似文章
OpenAI与Broadcom发布专为LLM推理优化的芯片
OpenAI与Broadcom发布了Jalapeño,一款专为LLM推理定制的芯片,每瓦性能显著优于当前最先进水平,从零开始为当前及未来AI模型设计。
AI淘金热进入最危险阶段
谷歌通过向外部客户开放TPU并瞄准推理市场,正激进挑战英伟达在AI芯片领域的霸主地位,或将重塑全球AI经济格局。
谷歌正在使用英伟达的策略来打造有竞争力的AI芯片业务(11分钟阅读)
谷歌正在采用英伟达的策略来打造有竞争力的AI芯片业务,向Anthropic出租TPU计算能力,并提升推理性能以与英伟达的主导地位竞争。
Nvidia的Jensen Huang押注这家英国初创公司,打造AI的'下一个前沿'(3分钟阅读)
Nvidia宣布与Ineffable Intelligence合作,这是一家由前DeepMind科学家David Silver创立的英国AI初创公司,旨在开发用于超级智能的强化学习系统。该初创公司创纪录地筹集了11亿美元的种子轮融资。
OpenAI 推出其首款定制芯片,由 Broadcom 制造
OpenAI 发布了其首款自研推理处理器 Jalapeño,与 Broadcom 合作开发,旨在提升每瓦性能并减少对 Nvidia GPU 的依赖。