performance-benchmark

#performance-benchmark

@KyleHessling1: 使用我们即将发布的 Qwopus-Coder-35B-A3B 模型，在 @opencode 中完全制作了一款 RTS 游戏，已启用思考功能，设定了思考上限……

X AI KOLs Following ↗ · 昨天缓存

Kyle Hessling 宣布即将发布 Qwopus-Coder-35B-A3B 编程模型，并通过与 OpenCode 配合使用开发出一款功能完整的实时策略游戏来展示其能力。该模型在 GeForce RTX 5090 上实现了高速和草稿接受率。

0 人收藏 0 人点赞

#performance-benchmark

Reddit r/singularity ↗ · 6天前

一款新的日本AI模型取得了与领先的美国前沿模型相当的性能，标志着重大进展。

0 人收藏 0 人点赞

#performance-benchmark

Hacker News Top ↗ · 2026-06-13

使用 RTX 5080 和 RTX 3090 GPU 的配置在 Qwen 3.6 27B Q8 模型上实现了每秒 80 个令牌。

0 人收藏 0 人点赞

#performance-benchmark

X AI KOLs Timeline ↗ · 2026-05-12

一项性能测试展示了低、自动和高性能模式对 M5 Max MacBook 上大型语言模型（LLM）推理速度的影响，显示出在 Token 生成率和功耗方面存在显著差异。

0 人收藏 0 人点赞

#performance-benchmark

Reddit r/LocalLLaMA ↗ · 2026-05-12

Luce 为 AMD Strix Halo APU 发布了 DFlash 和 PFlash 支持，在 Qwen3.6-27B 模型上，其解码和预填充速度相比 llama.cpp HIP 分别提升了 2.23 倍和 3.05 倍。

0 人收藏 0 人点赞

#performance-benchmark

Reddit r/LocalLLaMA ↗ · 2026-05-10

本文征求社区对 HIPfire 在 AMD Strix Halo 硬件上的性能和质量评估，特别是与 llama.cpp 相比的长上下文支持情况。

0 人收藏 0 人点赞

#performance-benchmark

X AI KOLs Timeline ↗ · 2026-05-08 缓存

一位用户成功在三个 GTX 1080 Ti GPU 上对 27B 参数的 Qwen 模型进行本地推理，通过 TurboQuant 优化达到了约 28-30 tokens/秒的速度。

0 人收藏 0 人点赞