@zephyr_z9: 这太重要了,我认为这是第一个实用的推测解码方法,部署在大型准前沿模型上 M…

X AI KOLs Following 模型

摘要

小米 MiMo 发布 MiMo-V2.5-Pro-UltraSpeed,通过推测解码在 1 万亿参数模型上实现每秒超过 1000 个 token,这是首次大规模实际部署如此速度。

这太重要了 我认为这是第一个实用的推测解码方法,部署在大型准前沿模型上 巨大的解锁 @fi56622380 https://t.co/augiaFLDOK
查看原文
查看缓存全文

缓存时间: 2026/06/09 10:45

这实在太大了 我认为这是首个在大型准前沿模型上部署的有用投机解码方法 巨大解锁 @fi56622380 https://t.co/augiaFLDOK

Xiaomi MiMo (@XiaomiMiMo): 🚀 1万亿参数模型实现每秒1000+ tokens!🚀

我们激动地宣布,与@TileRT_AI合作推出Xiaomi MiMo-V2.5-Pro-UltraSpeed,在1万亿参数模型上首次突破每秒1000 tokens的输出速度!

这不是Cerebras那样的晶圆级集成。也不是纯粹…

相似文章

XiaomiMiMo/MiMo-V2.5-Pro

Hugging Face Models Trending

小米发布了 MiMo-V2.5-Pro,这是一个开源的 MoE 语言模型,拥有 1.02T 总参数和 1M token 上下文长度,专为复杂的智能体(Agent)和软件工程任务进行了优化。