@seclink: 小米放了个大的:申请 MiMo-V2.5-Pro-UltraSpeed 内测 满血性能,1000 tokens/s 峰值速度。彻底解放了 Coding Agent 的生产力极限。 试用资源有限,每日限量审批,仅优先定向专业机构。
摘要
小米推出 MiMo-V2.5-Pro-UltraSpeed 模型内测,峰值速度达1000 tokens/s,旨在提升 Coding Agent 的生产力。试用资源有限,定向专业机构。
查看缓存全文
缓存时间: 2026/06/10 15:53
小米放了个大的:申请 MiMo-V2.5-Pro-UltraSpeed 内测 满血性能,1000 tokens/s 峰值速度。彻底解放了 Coding Agent 的生产力极限。
试用资源有限,每日限量审批,仅优先定向专业机构。
https://t.co/lg7NsRTwKp
相似文章
小米刚刚声称在标准8-GPU服务器上对1T模型实现了1000+ tps
小米与TileRT合作发布了MiMo-V2.5-Pro-UltraSpeed,在1万亿参数模型上实现了超过1000 tokens/s的解码速度,支持实时AI交互,并加速了编程代理和推理任务。
@zephyr_z9: 这太重要了,我认为这是第一个实用的推测解码方法,部署在大型准前沿模型上 M…
小米 MiMo 发布 MiMo-V2.5-Pro-UltraSpeed,通过推测解码在 1 万亿参数模型上实现每秒超过 1000 个 token,这是首次大规模实际部署如此速度。
@heyshrutimishra:中国以低40-60%的token成本追平美国前沿代码AI!小米刚发布MiMo-V2.5-Pro…
小米推出MiMo-V2.5-Pro,在SWE-Bench Pro得分73.7(接近Claude Opus 4.6的77.1),token成本比美国前沿模型低40-60%。
@seclink: 小米发布了 mimo-code ,可以下载代码用起来
小米发布了 MiMoCode,一个具有跨会话记忆的开源 AI 编码助手,可在 GitHub 上获取,并通过一行命令或 npm 安装。
中国小米的MiMo现在比ChatGPT和Claude快15倍(4分钟阅读)
小米通过FP4量化和DFlash投机解码,在商用8-GPU节点上实现了其万亿参数模型MiMo-V2.5-Pro-UltraSpeed每秒超过1000 tokens的推理速度,性能超过GPT-5.5和Claude Opus 10倍以上。