model-comparison

#model-comparison

eTPS 网站计划 – 简单排行榜 + 您将实际看到的内容

Reddit r/artificial ↗ · 2天前

作者介绍了effectiveTPS的网站计划，这是一款使用新的'eTPS'指标（有效TPS）以及原始速度和延迟来比较本地AI模型的工具。其目标是提供一个简单的排行榜，突出展示有用的输出质量，而非原始营销数字。

0 人收藏 0 人点赞

#model-comparison

恕我无知，但27B模型怎么会比397B更强？

Reddit r/LocalLLaMA ↗ · 2026-04-22

用户质疑Qwen的27B稠密模型为何能胜过其397B MoE版本，引发关于MoE效率与稠密模型质量的讨论。

0 人收藏 0 人点赞

#model-comparison

Qwen 3.6 35B A3B 与 Qwen 3.5 122B A10B 对比

Reddit r/LocalLLaMA ↗ · 2026-04-22

用户反馈，尽管基准测试表现亮眼，Qwen 3.5 122B 在多步任务上大幅领先 Qwen 3.6 35B，怀疑是量化或部署配置问题。

0 人收藏 0 人点赞

#model-comparison

最近 6 个月的开源模型汇总（2025 年 11 月 – 2026 年 4 月）

Reddit r/LocalLLaMA ↗ · 2026-04-22

社区整理的图表显示 2025 年 11 月至 2026 年 4 月开源大模型爆发式增长，仅保留最新版本与较大参数模型以避免信息过载。

0 人收藏 0 人点赞

#model-comparison

为什么A10b以下的MOE让我像在赌博

Reddit r/LocalLLaMA ↗ · 2026-04-22

开发者报告称，像 qwen3.6-35b-A3b 这种“活跃参数量”较小的 MOE 模型，相比稠密的 qwen3.5-27b，一致性更低、需要更多引导，很难直接塞进智能体工作流。

0 人收藏 0 人点赞

#model-comparison

Kimi K2.6 是真正的 Opus 4.7 替代品

Reddit r/LocalLLaMA ↗ · 2026-04-21

经过实测并结合部分客户反馈，这是目前首款让我有底气向客户推荐用于替代 Opus 4.7 的模型。虽然它在单项能力上并未明显超越 Opus 4.7，但能以可接受的质量完成 Opus 约 85% 的任务，同时还配备了视觉理解和强大的浏览器操作能力。我最近一直在逐步将部分个人工作流迁移至 Kimi K2.6，表现令人惊喜，尤其在长周期任务中尤为出色。尽管该模型体积庞大，

0 人收藏 0 人点赞

#model-comparison

@QuixiAI：太猛了，@Kimi_Moonshot！看来我们不需要 @deepseek_ai v4 了。（AI 发展太快，根本坐不住。）

X AI KOLs Following ↗ · 2026-04-20 缓存

社交媒体帖子暗示 Kimi Moonshot 的最新模型已超越人们对 DeepSeek v4 的期待。

0 人收藏 0 人点赞

#model-comparison

@interjc: 果然 AI 时代不能轻易年付被年初 Google AI Pro 的暴力性价比套餐破了戒，结果没曾想，交完钱不到一个月，Antigravity / gemini cli 就成了一坨屎，胡乱封号不说，gemini pro 系列模型也被 cl…

X AI KOLs Following ↗ · 2026-04-20 缓存

用户在社交媒体上抱怨年初订阅的 Google AI Pro 服务迅速贬值，Antigravity 与 gemini cli 体验恶化且存在封号问题，同时认为 Gemini Pro 及 nano banana 在性能上已被 Claude、GPT 及 GPT Image 2 超越。

0 人收藏 0 人点赞

#model-comparison

Claude Token Counter，现已支持模型对比

Simon Willison's Blog ↗ · 2026-04-20 缓存

Simon Willison 升级了他的 Claude Token Counter 工具，增加了对不同 Claude 模型之间的 token 数量对比功能。升级后的工具发现，Claude Opus 4.7 采用的新分词器相比 Opus 4.6 对相同文本需要多 1.46 倍的 token，这导致成本增加约 40%，尽管两个模型定价相同。

0 人收藏 0 人点赞

#model-comparison

从 Opus 4.7 切换到 Qwen-35B-A3B

Reddit r/LocalLLaMA ↗ · 2026-04-19

社区讨论：将编码代理从 Claude Opus 4.7 切换至 Qwen-35B-A3B，寻求用户体验与性能对比。

0 人收藏 0 人点赞

#model-comparison

我的笔记本上的Qwen3.6-35B-A3B画出的鹈鹕比Claude Opus 4.7更好

Simon Willison's Blog ↗ · 2026-04-16 缓存

Simon Willison对比了在MacBook Pro上本地运行的Qwen3.6-35B-A3B与Claude Opus 4.7，发现Qwen生成的骑自行车的鹈鹕和骑独轮车的火烈鸟的SVG插图更好，不过他指出这个狭窄的基准测试并不能反映更广泛的模型能力。

0 人收藏 0 人点赞

model-comparison

提交意见反馈