performance-benchmark

标签

Cards List
#performance-benchmark

@KyleHessling1: 使用我们即将发布的 Qwopus-Coder-35B-A3B 模型,在 @opencode 中完全制作了一款 RTS 游戏,已启用思考功能,设定了思考上限……

X AI KOLs Following · 昨天 缓存

Kyle Hessling 宣布即将发布 Qwopus-Coder-35B-A3B 编程模型,并通过与 OpenCode 配合使用开发出一款功能完整的实时策略游戏来展示其能力。该模型在 GeForce RTX 5090 上实现了高速和草稿接受率。

0 人收藏 0 人点赞
#performance-benchmark

日本新模型性能堪比美国前沿模型

Reddit r/singularity · 6天前

一款新的日本AI模型取得了与领先的美国前沿模型相当的性能,标志着重大进展。

0 人收藏 0 人点赞
#performance-benchmark

RTX 5080 和 RTX 3090 配置:在 Qwen 3.6 27B Q8 上达到 80 令牌/秒

Hacker News Top · 2026-06-13

使用 RTX 5080 和 RTX 3090 GPU 的配置在 Qwen 3.6 27B Q8 模型上实现了每秒 80 个令牌。

0 人收藏 0 人点赞
#performance-benchmark

@ivanfioravanti: M5 Max 的有趣视频,探讨低、自动和高性能模式对推理的影响。- 未连接外部显示器……

X AI KOLs Timeline · 2026-05-12

一项性能测试展示了低、自动和高性能模式对 M5 Max MacBook 上大型语言模型(LLM)推理速度的影响,显示出在 Token 生成率和功耗方面存在显著差异。

0 人收藏 0 人点赞
#performance-benchmark

AMD Strix Halo 上的 Luce DFlash + PFlash:Qwen3.6-27B 解码速度提升 2.23 倍,预填充速度提升 3.05 倍(相较于 llama.cpp HIP)

Reddit r/LocalLLaMA · 2026-05-12

Luce 为 AMD Strix Halo APU 发布了 DFlash 和 PFlash 支持,在 Qwen3.6-27B 模型上,其解码和预填充速度相比 llama.cpp HIP 分别提升了 2.23 倍和 3.05 倍。

0 人收藏 0 人点赞
#performance-benchmark

HIPfire 是否值得用于 Strix Halo?

Reddit r/LocalLLaMA · 2026-05-10

本文征求社区对 HIPfire 在 AMD Strix Halo 硬件上的性能和质量评估,特别是与 llama.cpp 相比的长上下文支持情况。

0 人收藏 0 人点赞
#performance-benchmark

@rumgewieselt:现在变得疯狂了……三块 1080 Ti(Pascal架构,33GB VRAM)Qwen 3.6 27B MTP 搭配 196K TurboQuant,持续 ~28-30 t/s

X AI KOLs Timeline · 2026-05-08 缓存

一位用户成功在三个 GTX 1080 Ti GPU 上对 27B 参数的 Qwen 模型进行本地推理,通过 TurboQuant 优化达到了约 28-30 tokens/秒的速度。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈