@dbreunig:大版本发布:RLM 优化、优化链串联、LiteLLM 解耦启动,并有 24 位首次贡献者…
摘要
重磅开源版本:RLM 优化、优化链串联、LiteLLM 解耦启动,迎来 24 位新贡献者。
大版本发布:RLM 优化、优化链串联、LiteLLM 解耦启动,并有 24 位首次贡献者!
查看缓存全文
缓存时间: 2026/04/22 06:20
本次大版本带来 RLM 改进、优化链式调用、开启 LiteLLM 解耦,并有 24 位首次贡献者!
相似文章
@vllm_project: vLLM v0.21.0 发布!367 次提交,来自 202 位贡献者(其中 49 位新贡献者)。亮点:KV 卸载 + HMA、带思考预算的推测解码(适用于推理模型)……
vLLM v0.21.0 已发布,新增 KV 卸载 + HMA、面向推理模型的带思考预算的推测解码、适用于 DSR1/Kimi K2.5 的 Blackwell 上的 TOKENSPEED_MLA、Mooncake 分布式 KV、DeepSeek V4 流水线并行,以及 C++20 + Transformers v5 基线。
@huang_chao4969: LightRAG v1.5 来了!史上最大更新!35k+ GitHub | 1.1M+ 下载量 | 251 位贡献者 | 1.1k+ PR 已合并…
LightRAG v1.5 已发布,带来六大重大改进,包括多模态文档处理、增强的解析功能以及角色特定的 LLM 配置,使 RAG 更简单、更快速、更强大。
@RedHat_AI: Michael Goin (@mgoin_) 详解 @vllm_project v0.20.0。752 次提交。320 位贡献者。123 位新贡献者。DeepSeek V4, TurboQ…
Michael Goin 回顾了 vLLM v0.20.0 的发布,重点介绍了 752 次代码提交以及新功能,包括对 DeepSeek V4 的支持、TurboQuant 技术以及 PyTorch 2.11 的集成。
vllm-project/vllm v0.19.1rc0: [Misc] 清理 Gemma4 实现 (#38872)
vLLM v0.19.1rc0 版本包含对 Gemma4 实现的清理,这是对该流行的开源大语言模型推理与服务库的常规维护与优化的一部分。
@isaacbmiller1:DSPy 3.2.0 发布!亮点速览:- dspy.RLM 在解析、工具执行与故障恢复方面的改进……
DSPy 3.2.0 优化了 dspy.RLM 的解析、工具执行与故障恢复,并持续推进与 LiteLLM 的解耦。