为什么没人谈论 Mimo V2.5 (non-pro)

Reddit r/singularity 模型

摘要

Mimo V2.5 提供了与 Claude Opus 4.5 相当的性能,但成本仅为后者的一小部分,使其成为执行代理任务的极具性价比的 AI 模型。

在 Artificial Analysis Intelligence 指数上,Mimo V2.5 得分为49,与 Claude 4.5 Opus 的49.7相当,但其完成整个基准测试的成本仅为 Gemini 3.1 Flash Lite(AA Intelligence 指数得分为33.5)的一半左右。以下是成本对比:Claude Opus 4.5: $2,969;Gemini 3.1 Pro: $892;Gemini 3.1 Flash Lite: $94;Mimo V2.5: $49。根据我的经验,它的执行力似乎比 Gemini 更强,并且不太可能声称完成了实际上并未完成的任务。而且,使用 Qwen CLI(Qwen 团队为更好地支持第三方模型而开发的 Gemini CLI 分支)时延迟非常低,因为它能非常快速地运行代理循环。有一些关于 Mimo V2.5 Pro 的讨论,其价格为 $161,得分为53.8。但我觉得,以三分之一的价格,你就能获得大部分智能,而且我认为 Mimo V2.5 Pro 在处理包含大量子代理的大型代理任务时表现最佳,且无需订阅。我认为这是第一个让我觉得可以放心消耗 token 而无需短期折扣的 API,它的智能在保持清醒和专注于任务方面与那些重量级模型不相上下。从 Artificial Analysis 的智能与成本图表来看,它几乎碾压了一切,Pro 版也是如此,但非 Pro 版尤甚,只有 Deepseek V4 Flash 稍贵一些且智能稍逊。
查看原文

相似文章

XiaomiMiMo/MiMo-V2.5-Pro

Hugging Face Models Trending

小米发布了 MiMo-V2.5-Pro,这是一个开源的 MoE 语言模型,拥有 1.02T 总参数和 1M token 上下文长度,专为复杂的智能体(Agent)和软件工程任务进行了优化。