vllm-project/vllm v0.21.1rc0: [ROCm][CI] Stage B 门控 (#42025)

GitHub Releases Watchlist 工具

摘要

vLLM 发布版本 0.21.1rc0,重点关注 ROCm CI 门控改进。

签署人:Andreas Karatzas [email protected]
查看原文
查看缓存全文

缓存时间: 2026/05/15 09:27

Easy, fast, and cheap LLM serving for everyone

| 文档 | 博客 | 论文 | Twitter/X | 用户论坛 | 开发者 Slack |

相似文章

vllm-project/vllm v0.21.0rc1

GitHub Releases Watchlist

vLLM v0.21.0rc1 是高性能大语言模型推理和服务库的预发布更新,主要功能包括针对吞吐量、量化以及硬件支持的优化。

vllm-project/vllm v0.20.0rc1

GitHub Releases Watchlist

vLLM 0.20.0rc1 发布,带来吞吐量、量化、投机解码及多硬件支持的重大改进,助力可扩展的大模型推理服务。

vllm-project/vllm v0.20.1

GitHub Releases Watchlist

vLLM v0.20.1 是一个小版本更新,针对这款流行的开源大语言模型推理和服务库,继续保持其高吞吐量和高效内存管理的核心优势。