我们什么时候才能买到消费级推理芯片?

Reddit r/LocalLLaMA 新闻

摘要

文章质疑为何没有创业公司推出售价 200–300 美元、内置 Llama 3 的消费级推理芯片,并暗示行业更偏爱靠 API 订阅持续赚钱,而非一次性硬件销售。

可能是个蠢问题,但我真搞不懂。过去几年 AI 创业公司砸了几十亿美元,却没人把模型直接做进一块消费级芯片?比如一根 200 美元的 U 盘,30 W 功耗、阅读速度跑 Llama 3,插上电脑就能用,完事。Taalas 有点像在做,但只面向数据中心。为啥?现在的开源模型对 90% 的日常需求已经绰绰有余,未来几年照样够用。“模型还没流片就过时” 的说法越来越站不住脚。我开始怀疑,整个行业是不是就想靠 API 订阅一直薅消费者羊毛,而不肯一次性卖芯片。感觉花 300 美元做个 “Llama 盒子” 肯定能赚钱,但可能没人愿意让持续收入停下来。我漏了啥?
查看原文

相似文章