vllm-project/vllm v0.19.2rc0:[错误修复] 修复 GLM-ASR 中 k_proj 的偏置问题(#40160)
摘要
vLLM v0.19.2rc0 候选版本包含了对 GLM-ASR 模型中 k_proj 偏置处理的错误修复,解决了 LLM 服务框架中的一个特定兼容性问题。
Signed-off-by: Rishapveer Singh [email protected]
查看缓存全文
缓存时间: 2026/04/20 08:36
为每个人提供简单、快速、低成本的LLM服务
| 文档 | 博客 | 论文 | Twitter/X | 用户论坛 | 开发者Slack |
相似文章
vllm-project/vllm v0.19.1rc0: [Misc] 清理 Gemma4 实现 (#38872)
vLLM v0.19.1rc0 版本包含对 Gemma4 实现的清理,这是对该流行的开源大语言模型推理与服务库的常规维护与优化的一部分。
vllm-project/vllm v0.21.0rc1
vLLM v0.21.0rc1 是高性能大语言模型推理和服务库的预发布更新,主要功能包括针对吞吐量、量化以及硬件支持的优化。
vllm-project/vllm v0.20.1
vLLM v0.20.1 是一个小版本更新,针对这款流行的开源大语言模型推理和服务库,继续保持其高吞吐量和高效内存管理的核心优势。
vllm-project/vllm v0.20.0rc1
vLLM 0.20.0rc1 发布,带来吞吐量、量化、投机解码及多硬件支持的重大改进,助力可扩展的大模型推理服务。
vllm-project/vllm v0.19.1
vLLM v0.19.1 发布 - 一个快速易用的开源 LLM 推理和服务库,拥有业界领先的吞吐量,支持 200+ 个模型架构以及包括 NVIDIA/AMD GPU 和 CPU 在内的多样化硬件。