小米 MiMo-v2.5 系列 API 永久降价高达 99%

Hacker News Top 产品

摘要

小米宣布其 MiMo-V2.5 系列 API 永久降价高达 99%,同时进行计费系统优化和技术推理改进。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/26 18:57

# 小米 MiMo API 开放平台 Token Plan 全球上线 来源:https://platform.xiaomimimo.com/docs/en-US/news/v2.5-price-update ## MiMo-V2.5 系列价格调整公告 | 100万亿 Token 创作者激励计划圆满收官 过去几个月,通过 MiMo Orbit 和百万亿 Token 创作者激励计划等活动,我们让更多人得以体验 MiMo、解决真实问题——这是 MiMo 走向大规模应用的第一步。 现在,随着底层技术的持续提升,我们终于可以做一件更彻底的事——**永久性革新整个模型定价体系**。 **本次公告核心要点速览:** - MiMo-V2.5 系列 API 永久降价 - Token Plan 计费系统优化,用量提升至原来的 5~8 倍 - 百万亿 Token 创作者激励计划圆满收官 - 当前有效的 Token Plan 用户额度全部重置 生效时间:2026年5月27日 北京时间 00:00 ## MiMo-V2.5 系列 API 永久降价 相较于原有 API 定价,新定价最高可降低 99%,且不再区分输入长度。 图片 **本次价格调整于北京时间 5 月 27 日 00:00 正式生效,全球同步。诚邀各位开发者接入体验。** ## Token Plan 计费系统优化 - **加量不加价,用量提升至原来的 5~8 倍,为你解锁更充沛的生产力** - **计费规则调整得更清晰易懂,所见即所得。** 图片 ## 百万亿 Token 创作者激励计划圆满收官 自 4 月 28 日启动以来,"百万亿 Token 创作者激励计划"受到全球用户的热烈追捧与广泛关注。截至北京时间 5 月 26 日 16:08,全部 100T Token 已提前发放完毕,活动已提前圆满结束。感谢各位开发者的热情参与! 说明:Apache 软件基金会成员专属福利活动长期有效,可继续申请,不受本次收官影响。 图片 ## 惊喜:所有现有 Token Plan 用户额度全部重置 无论当前套餐用量如何,所有已订阅 Token Plan 且仍在有效期内的用户(包括参与百万亿 Token 创作者激励计划获得 Token Plan 的用户,以及 Apache 软件基金会专属福利用户),其 Credits 额度将于北京时间 5 月 27 日 00:00 全部重置,并按照新的计费规则执行。 另外:针对历史付费用户的 Token Plan 已过期用户,我们也准备了惊喜礼物,将于未来一周内公布,敬请期待。 ## 推理技术优化说明 此次调价背后,是小米技术团队对推理系统的持续优化。 我们全面支持基于 SGLang HiCache 的 SWA(滑动窗口注意力),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储间的数据传输量降至优化前的近 **1/7**,可缓存 Token 数量提升至优化前的近 **5 倍**,大幅提升缓存命中率和推理效率。 同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群的输入吞吐能力,从而在保障服务质量的前提下,持续降低每 Token 服务成本。 ## 结语 技术的价值,最终在于使用的广度。 依托持续的技术创新,我们希望通过提供低成本与顶尖能力兼备的模型服务,激发真实、可持续、大规模的推理需求,从而推动完整 AI 基础设施链的建设。 让更多人用上更好的模型——这是 MiMo 始终不变的使命。

相似文章

XiaomiMiMo/MiMo-V2.5-Pro

Hugging Face Models Trending

小米发布了 MiMo-V2.5-Pro,这是一个开源的 MoE 语言模型,拥有 1.02T 总参数和 1M token 上下文长度,专为复杂的智能体(Agent)和软件工程任务进行了优化。