为什么没人谈论 Mimo V2.5 (non-pro)
摘要
Mimo V2.5 提供了与 Claude Opus 4.5 相当的性能,但成本仅为后者的一小部分,使其成为执行代理任务的极具性价比的 AI 模型。
在 Artificial Analysis Intelligence 指数上,Mimo V2.5 得分为49,与 Claude 4.5 Opus 的49.7相当,但其完成整个基准测试的成本仅为 Gemini 3.1 Flash Lite(AA Intelligence 指数得分为33.5)的一半左右。以下是成本对比:Claude Opus 4.5: $2,969;Gemini 3.1 Pro: $892;Gemini 3.1 Flash Lite: $94;Mimo V2.5: $49。根据我的经验,它的执行力似乎比 Gemini 更强,并且不太可能声称完成了实际上并未完成的任务。而且,使用 Qwen CLI(Qwen 团队为更好地支持第三方模型而开发的 Gemini CLI 分支)时延迟非常低,因为它能非常快速地运行代理循环。有一些关于 Mimo V2.5 Pro 的讨论,其价格为 $161,得分为53.8。但我觉得,以三分之一的价格,你就能获得大部分智能,而且我认为 Mimo V2.5 Pro 在处理包含大量子代理的大型代理任务时表现最佳,且无需订阅。我认为这是第一个让我觉得可以放心消耗 token 而无需短期折扣的 API,它的智能在保持清醒和专注于任务方面与那些重量级模型不相上下。从 Artificial Analysis 的智能与成本图表来看,它几乎碾压了一切,Pro 版也是如此,但非 Pro 版尤甚,只有 Deepseek V4 Flash 稍贵一些且智能稍逊。
相似文章
Mimo V 2.5 与 Mimo V 2.5 Pro 正式发布
Mimo V 2.5 及 Mimo V 2.5 Pro 现已发布,带来全新功能与多项改进。
价格战开始。MiMo 2.5 Pro现在与DeepSeek V4 Pro价格相同
MiMo 2.5 Pro降低了价格以对标DeepSeek V4 Pro,引发了AI模型提供商之间的价格战。
XiaomiMiMo/MiMo-V2.5-Pro
小米发布了 MiMo-V2.5-Pro,这是一个开源的 MoE 语言模型,拥有 1.02T 总参数和 1M token 上下文长度,专为复杂的智能体(Agent)和软件工程任务进行了优化。
大模型价值之争 - DeepSeek V4 Pro vs MiMo-V2.5-Pro vs MiniMax M3
一场讨论,比较DeepSeek V4 Pro、MiMo-V2.5-Pro和MiniMax M3在本地或OpenRouter使用中的最佳性价比,重点关注代理和编码任务,并提及Hermes Agent和Qwen 3.6变体。
Mimo 2.5 在大上下文下_快速_(双 RTX Pro 6000)
Mimo 2.5 使用双 RTX Pro 6000 GPU 展示了在大上下文窗口下的快速性能。