@KevinNaughtonJr: 向Jason及其团队表示疯狂的巨大祝贺!
摘要
Kevin Naughton Jr. 祝贺Jason Goodison筹集1500万美元,打造通用计算(General Compute)——一个以ASIC优先的推理云,声称在大多数模型上比GPU快5-8倍。
查看缓存全文
缓存时间: 2026/05/30 22:27
绝对疯狂!热烈祝贺 Jason 和整个团队!
Jason Goodison (@GoodisonJason): 我们筹集了1500万美元,用于构建以ASIC为先的推理云服务。
我们大力押注GPU以外的替代方案,结果是对大多数模型我们已经实现了5-8倍的性能提升。
点击查看Tech Crunch上关于General Compute的更多内容!
@FPuklowski @fastinference
相似文章
通用计算
通用计算是一款产品,提供针对速度优化的推理云,用于运行AI模型。
@bastani_behnam:我们刚刚发布了如何在 27B 模型上解锁 +50% 推理容量——无需新 GPU、无需新节点,成本仅为一小部分……
OpenInfer 展示“垂直拆解”,通过单节点 AMD EPYC CPU 与 Nvidia L40S GPU 协同执行量化层,并配合自定义 SLA 感知调度器,将 Qwen 3.5 27B 的吞吐量提升约 50%。
@rohanpaul_ai: @TensordyneInc 在推理机架方面取得了重大突破。他们刚刚宣布了一款AI推理机架,声称……
Tensordyne 发布了 Napier AI 推理机架,声称通过使用对数空间数学来降低能耗和晶体管使用量,其吞吐量是 Nvidia NVL72 GB300 的 13 倍,可能颠覆推理硬件格局。
@HotAisle: 太棒了。我想知道他们用的是谁的 MI300x... ;-)
Kog 宣布在标准数据中心 GPU 上实现每请求每秒 3000+ 输出令牌的实时大语言模型推理,将此前仅限于定制芯片的高速推理引入生产硬件。
构建智能时代的计算基础设施
OpenAI宣布通过Stargate项目突破10GW计算基础设施里程碑,强调通过与生态系统合作伙伴的协作和社区参与实现快速扩张,以满足加速增长的AI需求。