model-comparison

标签

Cards List
#model-comparison

eTPS 网站计划 – 简单排行榜 + 您将实际看到的内容

Reddit r/artificial · 2天前

作者介绍了effectiveTPS的网站计划,这是一款使用新的'eTPS'指标(有效TPS)以及原始速度和延迟来比较本地AI模型的工具。其目标是提供一个简单的排行榜,突出展示有用的输出质量,而非原始营销数字。

0 人收藏 0 人点赞
#model-comparison

恕我无知,但27B模型怎么会比397B更强?

Reddit r/LocalLLaMA · 2026-04-22

用户质疑Qwen的27B稠密模型为何能胜过其397B MoE版本,引发关于MoE效率与稠密模型质量的讨论。

0 人收藏 0 人点赞
#model-comparison

Qwen 3.6 35B A3B 与 Qwen 3.5 122B A10B 对比

Reddit r/LocalLLaMA · 2026-04-22

用户反馈,尽管基准测试表现亮眼,Qwen 3.5 122B 在多步任务上大幅领先 Qwen 3.6 35B,怀疑是量化或部署配置问题。

0 人收藏 0 人点赞
#model-comparison

最近 6 个月的开源模型汇总(2025 年 11 月 – 2026 年 4 月)

Reddit r/LocalLLaMA · 2026-04-22

社区整理的图表显示 2025 年 11 月至 2026 年 4 月开源大模型爆发式增长,仅保留最新版本与较大参数模型以避免信息过载。

0 人收藏 0 人点赞
#model-comparison

为什么A10b以下的MOE让我像在赌博

Reddit r/LocalLLaMA · 2026-04-22

开发者报告称,像 qwen3.6-35b-A3b 这种“活跃参数量”较小的 MOE 模型,相比稠密的 qwen3.5-27b,一致性更低、需要更多引导,很难直接塞进智能体工作流。

0 人收藏 0 人点赞
#model-comparison

Kimi K2.6 是真正的 Opus 4.7 替代品

Reddit r/LocalLLaMA · 2026-04-21

经过实测并结合部分客户反馈,这是目前首款让我有底气向客户推荐用于替代 Opus 4.7 的模型。虽然它在单项能力上并未明显超越 Opus 4.7,但能以可接受的质量完成 Opus 约 85% 的任务,同时还配备了视觉理解和强大的浏览器操作能力。我最近一直在逐步将部分个人工作流迁移至 Kimi K2.6,表现令人惊喜,尤其在长周期任务中尤为出色。尽管该模型体积庞大,

0 人收藏 0 人点赞
#model-comparison

@QuixiAI:太猛了,@Kimi_Moonshot!看来我们不需要 @deepseek_ai v4 了。(AI 发展太快,根本坐不住。)

X AI KOLs Following · 2026-04-20 缓存

社交媒体帖子暗示 Kimi Moonshot 的最新模型已超越人们对 DeepSeek v4 的期待。

0 人收藏 0 人点赞
#model-comparison

@interjc: 果然 AI 时代不能轻易年付 被年初 Google AI Pro 的暴力性价比套餐破了戒,结果没曾想,交完钱不到一个月,Antigravity / gemini cli 就成了一坨屎,胡乱封号不说,gemini pro 系列模型也被 cl…

X AI KOLs Following · 2026-04-20 缓存

用户在社交媒体上抱怨年初订阅的 Google AI Pro 服务迅速贬值,Antigravity 与 gemini cli 体验恶化且存在封号问题,同时认为 Gemini Pro 及 nano banana 在性能上已被 Claude、GPT 及 GPT Image 2 超越。

0 人收藏 0 人点赞
#model-comparison

Claude Token Counter,现已支持模型对比

Simon Willison's Blog · 2026-04-20 缓存

Simon Willison 升级了他的 Claude Token Counter 工具,增加了对不同 Claude 模型之间的 token 数量对比功能。升级后的工具发现,Claude Opus 4.7 采用的新分词器相比 Opus 4.6 对相同文本需要多 1.46 倍的 token,这导致成本增加约 40%,尽管两个模型定价相同。

0 人收藏 0 人点赞
#model-comparison

从 Opus 4.7 切换到 Qwen-35B-A3B

Reddit r/LocalLLaMA · 2026-04-19

社区讨论:将编码代理从 Claude Opus 4.7 切换至 Qwen-35B-A3B,寻求用户体验与性能对比。

0 人收藏 0 人点赞
#model-comparison

我的笔记本上的Qwen3.6-35B-A3B画出的鹈鹕比Claude Opus 4.7更好

Simon Willison's Blog · 2026-04-16 缓存

Simon Willison对比了在MacBook Pro上本地运行的Qwen3.6-35B-A3B与Claude Opus 4.7,发现Qwen生成的骑自行车的鹈鹕和骑独轮车的火烈鸟的SVG插图更好,不过他指出这个狭窄的基准测试并不能反映更广泛的模型能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈