一家小型公司抢了AMD的风头，凭借采用老旧DDR4和28nm芯片的PCIe AI加速器，以仅240W功耗在本地运行700B参数大模型，向Nvidia发起挑战

Reddit r/ArtificialInteligence 2026/05/10 22:19 产品

ai-hardware inference-accelerator on-premise-ai llm-inference energy-efficiency pcie-card

摘要

台湾初创公司Skymizer发布了HTX301，这是一款PCIe AI加速器，采用较老的28nm芯片和DDR内存，仅需240W功耗即可在本地运行700B参数的大语言模型，对Nvidia和AMD的高功耗GPU解决方案构成挑战。

>*Skymizer发布了一款PCIe AI加速器，凭借旧技术向AMD和Nvidia发起挑战。* >*HTX301卡能够运行高达700B参数的大语言模型……功耗仅为240瓦……采用的是较老的28nm芯片以及标准的LPDDR4和LPDDR5内存，而非昂贵的HBM或GDDR解决方案。*

查看原文

查看缓存全文

缓存时间: 2026/05/10 22:24

# 一家小公司“截胡”AMD，并用运行700亿参数大模型的老旧PCIe AI加速器向英伟达发起挑战... 来源：https://www.techradar.com/pro/tiny-company-steals-amds-thunder-and-challenges-nvidia-with-old-tech-pcie-ai-accelerator-that-runs-700b-llms-locally-sipping-just-240w-thanks-to-decade-old-ddr4-and-28nm-chips --- - **Skymizer声称，庞大的AI模型不再需要超大规模GPU基础设施** - **老旧的28纳米芯片突然以令人惊讶的低功耗驱动大规模语言模型** - **HTX301将384 GB的内存压缩到一张PCIe加速器卡中** --- 一家名为Skymizer的台湾公司推出了一款PCIe AI加速器，凭借令人惊讶的“老旧”技术，同时向AMD (https://www.techradar.com/tag/amd) 和英伟达 (https://www.techradar.com/tag/nvidia) 发起挑战。 HTX301卡可以在单设备上运行高达700亿参数的语言模型，而功耗仅为240瓦。该卡通过使用较旧的28纳米芯片以及标准的LPDDR4和LPDDR5内存（而非昂贵的HBM或GDDR解决方案）实现了这一壮举。 ## 老技术芯片与现代AI加速器同台竞技 Skymizer声称，其卡片在每秒100 GB带宽、仅0.5 TOPS性能下即可达到每秒30个token的推理速度。 HTX301基于Skymizer的HyperThought平台构建，该平台拥有专为大型语言模型工作负载设计的下一代LPU IP。每张PCIe卡包含六颗协同工作的HTX301芯片，提供高达384 GB的总内存容量。该设计对权重和KV缓存采用了高效的压缩技术，性能比开源的llama.cpp高出9%至17.8%。订阅TechRadar Pro新闻通讯，获取您企业成功所需的所有顶尖新闻、观点、特稿和指南！其功耗低于AMD和英伟达领先的PCIe AI加速器通常所需功耗的一半。该卡支持用于编码、自动化和特定领域工作流的代理AI（Agentic AI），无需依赖超大规模GPU集群。在云环境中运行大型语言模型 (https://www.techradar.com/computing/artificial-intelligence/best-llms) 会引发隐私问题以及不可预测的成本，这是许多组织无法接受的。升级本地基础设施以支持大规模GPU加速器平台，往往需要对数据中心 (https://www.techradar.com/pro/best-data-center-proxies) 的供电和冷却系统进行昂贵的重新设计。 Skymizer的HTX301为企业提供了第三种选择，无需任何基础设施变更即可直接安装在标准风冷服务器中。该公司声称，凭借其新技术，需要超大规模GPU (https://www.techradar.com/news/computing-components/graphics-cards/best-graphics-cards-1291458) 集群来运行超大型LLM的时代已经结束。 PCIe卡形态允许企业在保持数据主权和可预测的基础设施成本的同时，在本地扩展AI推理能力。 ## Skymizer HTX301 等待现实世界的考验 Skymizer将于今年在Computex上预览HTX301，以便独立验证其性能数据。这款芯片的规格在纸面上看起来令人印象深刻，但实际测试将决定该卡是否真的能在Llama2 7B工作负载下实现每秒240个token的速度。 AMD近期推出了配备144 GB HBM3E内存的Instinct MI350P PCIe卡，在MXFP4精度下峰值TFLOPS高达4,600，但其功耗远高于Skymizer的产品。英伟达的RTX PRO 6000 Blackwell功耗约为600瓦，是Skymizer卡执行可比推理任务所需功耗的两倍多。如果HTX301能如宣传所言正常工作，它将大幅降低本地AI基础设施的入门门槛。若未能兑现承诺，Skymizer将加入众多未能证实其承诺的初创公司行列。信息来源：Wccftech (https://wccftech.com/this-pcie-ai-accelerator-card-packs-384-gb-memory-run-700b-llms-240w/#comments) --- 黑色背景上的Google标志，旁边写着“点击关注TechRadar”的文字 ***在Google News上关注TechRadar*** (https://news.google.com/publications/CAAqKAgKIiJDQklTRXdnTWFnOEtEWFJsWTJoeVlXUmhjaTVqYjIwb0FBUAE?hl=en-GB&gl=GB&ceid=GB%3Aen) 并 ***将我们设为首选来源*** (https://www.google.com/preferences/source?q=techradar.com)，*以便在您的信息流中获取我们的专家新闻、评测和观点。* ---

一家小型公司抢了AMD的风头，凭借采用老旧DDR4和28nm芯片的PCIe AI加速器，以仅240W功耗在本地运行700B参数大模型，向Nvidia发起挑战

相似文章

台湾公司Skymizer发布HTX301 - 配备384GB内存、功耗约240瓦的PCIE推理卡

AMD的小型AI PC预示着模型推理向本地化未来的转变

@realBigBrainAI: AMD首席执行官Lisa Su发布全球最小AI开发PC，可本地运行200B参数模型。

英特尔新月岛PCB泄露，展示巨大Xe3P GPU、16针接口、160GB LPDDR5X，英特尔规避HBM短缺

这家芯片初创公司刚融资1.35亿美元，押注AI的最大瓶颈不是计算，而是内存

提交意见反馈