coding-benchmark

标签

Cards List
#coding-benchmark

Open source battle: GLM vs Kimi vs MiMo vs DeepSeek

Reddit r/LocalLLaMA · 16小时前 缓存

本文测试了智谱GLM 5.1、月之暗面Kimi K2.6、阶跃星辰MIMO 2.5 Pro和深度求索DeepSeek V4 Pro四个开源中国AI模型在编程任务中的表现,发现GLM在多数任务中整体领先但非绝对,各模型各有优劣。

0 人收藏 0 人点赞
#coding-benchmark

@埃万·卢斯拉:Kimi K2 的训练成本仅为 460 万美元。据报道,GPT-5 耗资数亿美元。Kimi 在编程方面依然击败了它。上周…

X AI KOLs Timeline · 昨天

Kimi K2 以 460 万美元的训练成本,在编程基准测试中击败了 GPT-5 和 Claude Opus 4.7,其创始人还提供了详细的技术解析。

0 人收藏 0 人点赞
#coding-benchmark

搭配合适代理后,Qwen3.6-35B 可与云端模型一较高下

Reddit r/LocalLLaMA · 2026-04-22

将 Qwen3.6-35B 与 little-coder 代理框架结合,在 Polyglot 编程基准上达到 78.7%,跻身公开榜前十,直追云端模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈