tokens-per-second

#tokens-per-second

RTX 5080 和 RTX 3090 配置：在 Qwen 3.6 27B Q8 上达到 80 令牌/秒

Hacker News Top ↗ · 2026-06-13

使用 RTX 5080 和 RTX 3090 GPU 的配置在 Qwen 3.6 27B Q8 模型上实现了每秒 80 个令牌。

0 人收藏 0 人点赞

#tokens-per-second

Simon Willison's Blog ↗ · 2026-05-20 缓存

Simon Willison 探讨了 10 tokens per second 速度对于大型语言模型的实际意义，提供了关于这种速度感觉有多快以及其对可用性的影响的背景信息。

0 人收藏 0 人点赞