根据Arena排行榜,开放权重模型GLM和Mimo优于Gemini 3.5 Flash

Reddit r/LocalLLaMA 新闻

摘要

根据Arena排行榜,开放权重模型GLM和Mimo在编程基准测试中优于Gemini 3.5 Flash。

尽管我们正在经历Gemini 3.5 Flash的热潮,但请记住,根据Arena,GLM和Mimo更胜一筹。[https://arena.ai/leaderboard/text/coding-no-style-control](https://arena.ai/leaderboard/text/coding-no-style-control) #7 GLM #9 Mimo #12 Gemini 3.5 Flash
查看原文

相似文章

Gemini 3.5 Flash 基准测试

Reddit r/singularity

讨论了Gemini 3.5 Flash模型的基准测试结果,可能展示了它在各种AI任务上的表现。