10 tokens per second 到底有多快？

Simon Willison's Blog 2026/05/20 17:57 新闻

摘要

Simon Willison 探讨了 10 tokens per second 速度对于大型语言模型的实际意义，提供了关于这种速度感觉有多快以及其对可用性的影响的背景信息。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/05/20 18:38

# 10 tokens per second到底有多快？来源：https://simonwillison.net/2026/May/20/tokens-per-second/ 本文是Simon Willison的**链接博文**，发布于 **2026年5月20日**（https://simonwillison.net/2026/May/20/） ai2028（https://simonwillison.net/tags/ai/）generative-ai1795（https://simonwillison.net/tags/generative-ai/）llms1761（https://simonwillison.net/tags/llms/） ### 月度简报赞助我 **$10/月**，即可获得当月最重要LLM进展的邮件摘要。花钱让我少给你发邮件！赞助与订阅（https://github.com/sponsors/simonw/）

10 tokens per second 到底有多快？

相似文章

N tokens per second 到底有多快？

直观感受每秒 X 个 token 的实际速度

Token 最大化

Compute Optimal Tokenization (2分钟阅读)

@RedHat_AI: 145 tokens每秒。加入推测解码。424 tokens每秒。同一模型。同一H100。输出质量零变化…

提交意见反馈