shard

标签

Cards List
#shard

有人刚刚在跨美国6个州的6块消费级GPU上,通过开放互联网以30 tok/s的速度运行了一个744B参数的模型

Reddit r/ArtificialInteligence · 昨天

一位研究人员推出了Shard,在跨开放互联网的6块消费级GPU上分布式的744B参数模型实现了30 tok/s推理,相较之前的方法提升了15-20倍。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈