5.6 Sol 模型将于七月登陆 Cerebras,推理速度达每秒 750 token

Reddit r/singularity 模型

摘要

5.6 Sol 模型将于七月在 Cerebras 硬件上运行,提供每秒 750 token 的推理速度。

https://preview.redd.it/8nbr61qjzn9h1.png?width=1853&format=png&auto=webp&s=a223073294a2498e7557061f8b3fc822eb677f96 实在是太疯狂了
查看原文

相似文章

OpenAI与Cerebras合作

OpenAI Blog

OpenAI与Cerebras合作,将750MW超低延迟AI计算能力整合到其平台中,旨在加速推理,并在各种工作负载中实现更快的实时AI响应。