小米 MiMo-v2.5 系列 API 永久降价高达 99%
摘要
小米宣布其 MiMo-V2.5 系列 API 永久降价高达 99%,同时进行计费系统优化和技术推理改进。
暂无内容
查看缓存全文
缓存时间: 2026/05/26 18:57
# 小米 MiMo API 开放平台 Token Plan 全球上线
来源:https://platform.xiaomimimo.com/docs/en-US/news/v2.5-price-update
## MiMo-V2.5 系列价格调整公告 | 100万亿 Token 创作者激励计划圆满收官
过去几个月,通过 MiMo Orbit 和百万亿 Token 创作者激励计划等活动,我们让更多人得以体验 MiMo、解决真实问题——这是 MiMo 走向大规模应用的第一步。
现在,随着底层技术的持续提升,我们终于可以做一件更彻底的事——**永久性革新整个模型定价体系**。
**本次公告核心要点速览:**
- MiMo-V2.5 系列 API 永久降价
- Token Plan 计费系统优化,用量提升至原来的 5~8 倍
- 百万亿 Token 创作者激励计划圆满收官
- 当前有效的 Token Plan 用户额度全部重置
生效时间:2026年5月27日 北京时间 00:00
## MiMo-V2.5 系列 API 永久降价
相较于原有 API 定价,新定价最高可降低 99%,且不再区分输入长度。
图片
**本次价格调整于北京时间 5 月 27 日 00:00 正式生效,全球同步。诚邀各位开发者接入体验。**
## Token Plan 计费系统优化
- **加量不加价,用量提升至原来的 5~8 倍,为你解锁更充沛的生产力**
- **计费规则调整得更清晰易懂,所见即所得。**
图片
## 百万亿 Token 创作者激励计划圆满收官
自 4 月 28 日启动以来,"百万亿 Token 创作者激励计划"受到全球用户的热烈追捧与广泛关注。截至北京时间 5 月 26 日 16:08,全部 100T Token 已提前发放完毕,活动已提前圆满结束。感谢各位开发者的热情参与!
说明:Apache 软件基金会成员专属福利活动长期有效,可继续申请,不受本次收官影响。
图片
## 惊喜:所有现有 Token Plan 用户额度全部重置
无论当前套餐用量如何,所有已订阅 Token Plan 且仍在有效期内的用户(包括参与百万亿 Token 创作者激励计划获得 Token Plan 的用户,以及 Apache 软件基金会专属福利用户),其 Credits 额度将于北京时间 5 月 27 日 00:00 全部重置,并按照新的计费规则执行。
另外:针对历史付费用户的 Token Plan 已过期用户,我们也准备了惊喜礼物,将于未来一周内公布,敬请期待。
## 推理技术优化说明
此次调价背后,是小米技术团队对推理系统的持续优化。
我们全面支持基于 SGLang HiCache 的 SWA(滑动窗口注意力),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储间的数据传输量降至优化前的近 **1/7**,可缓存 Token 数量提升至优化前的近 **5 倍**,大幅提升缓存命中率和推理效率。
同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群的输入吞吐能力,从而在保障服务质量的前提下,持续降低每 Token 服务成本。
## 结语
技术的价值,最终在于使用的广度。
依托持续的技术创新,我们希望通过提供低成本与顶尖能力兼备的模型服务,激发真实、可持续、大规模的推理需求,从而推动完整 AI 基础设施链的建设。
让更多人用上更好的模型——这是 MiMo 始终不变的使命。
相似文章
我测试了小米 MiMo V2.5 Pro 在自主编程方面的表现:完成了 301 次提交,生成了 60 多页代码,API 费用仅 70 美元。如今它已开源。
小米已开源其 MiMo V2.5 Pro 模型,这是一个拥有 1020 亿参数、专为自主编码任务设计的混合专家(MoE)模型。本文详细介绍了一项现实世界中的测试,结果表明该模型凭借高缓存命中率实现了高效运行且 API 调用成本极低。
MiMo-V2.5 已发布
小米在 OpenRouter 上线了 MiMo-V2.5。
价格战开始。MiMo 2.5 Pro现在与DeepSeek V4 Pro价格相同
MiMo 2.5 Pro降低了价格以对标DeepSeek V4 Pro,引发了AI模型提供商之间的价格战。
万亿参数困境:MiMo-V2.5-Pro 开源(1.02T 参数)。当 API 处理 3.87 亿 Token 仅需 70 美元时,自托管还划算吗?
Xiaomi open-sourced MiMo-V2.5-Pro, a 1.02 trillion parameter MoE model, prompting a cost-benefit analysis of using its API versus self-hosting for autonomous coding tasks.
XiaomiMiMo/MiMo-V2.5-Pro
小米发布了 MiMo-V2.5-Pro,这是一个开源的 MoE 语言模型,拥有 1.02T 总参数和 1M token 上下文长度,专为复杂的智能体(Agent)和软件工程任务进行了优化。