标签
5.6 Sol 模型将于七月在 Cerebras 硬件上运行,提供每秒 750 token 的推理速度。
StepFun 发布了 Step-3.7-Flash,这是一个新的视觉语言 MoE 大模型,拥有 198B 参数(11B 激活),256K 上下文,推理速度高达 400 tokens/秒。