ultra-speed

标签

Cards List
#ultra-speed

小米刚刚声称在标准8-GPU服务器上对1T模型实现了1000+ tps

Reddit r/LocalLLaMA · 4天前 缓存

小米与TileRT合作发布了MiMo-V2.5-Pro-UltraSpeed,在1万亿参数模型上实现了超过1000 tokens/s的解码速度,支持实时AI交互,并加速了编程代理和推理任务。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈