tile-rt

标签

Cards List
#tile-rt

小米与TileRT在标准商用GPU上实现万亿参数模型推理速度超1000 TPS。定制芯片的时代结束了?

Reddit r/singularity · 2天前

小米与TileRT使用标准商用GPU,在万亿参数模型上实现了每秒超过1000个token的推理速度,这显示了定制芯片之外的一个重要替代方案。

0 人收藏 0 人点赞
#tile-rt

中国小米的MiMo现在比ChatGPT和Claude快15倍(4分钟阅读)

TLDR AI · 4天前 缓存

小米通过FP4量化和DFlash投机解码,在商用8-GPU节点上实现了其万亿参数模型MiMo-V2.5-Pro-UltraSpeed每秒超过1000 tokens的推理速度,性能超过GPT-5.5和Claude Opus 10倍以上。

0 人收藏 0 人点赞
#tile-rt

@zephyr_z9: 这太重要了,我认为这是第一个实用的推测解码方法,部署在大型准前沿模型上 M…

X AI KOLs Following · 4天前 缓存

小米 MiMo 发布 MiMo-V2.5-Pro-UltraSpeed,通过推测解码在 1 万亿参数模型上实现每秒超过 1000 个 token,这是首次大规模实际部署如此速度。

0 人收藏 0 人点赞
#tile-rt

小米刚刚声称在标准8-GPU服务器上对1T模型实现了1000+ tps

Reddit r/LocalLLaMA · 4天前 缓存

小米与TileRT合作发布了MiMo-V2.5-Pro-UltraSpeed,在1万亿参数模型上实现了超过1000 tokens/s的解码速度,支持实时AI交互,并加速了编程代理和推理任务。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈