Lemonade v10.7 发布及项目组织更新
摘要
Lemonade v10.7 版本引入了 LMX-Omni 虚拟模型,支持全模态聊天;新增 bench CLI 工具,用于跨后端比较 LLM 性能;并扩展了在 AMD、Apple Silicon、Nvidia 和 Intel 系统上的 GPU 支持。
今天的 [v10.7 发布](https://github.com/lemonade-sdk/lemonade/releases/tag/v10.7.0) 标志着 Lemonade 项目一个激动人心的新篇章的开始,因此我想分享一个项目层面的更新。Lemonade 的路线图和开发现在由 6 个 [工作组](https://lemonade-server.ai/docs/dev/working-groups/) 推动,其中 4 个由非 AMD 员工领导。以下是 v10.7 版本中来自 3 个工作组的亮点,该版本共有 19 位贡献者。
## 本地全模态模型
真正的全模态聊天,包括图像生成/编辑,通过无缝组合多个后端和模型实现。v10.7 使这些 [LMX-Omni](https://huggingface.co/lemonade-sdk/LMX-Omni-52B-Halo) 虚拟模型与 Open WebUI 及其他支持多媒体渲染的 OpenAI 客户端兼容。
## 自动调优
每个系统都应获得最佳性能,用户无需担心优化标志。v10.7 通过添加 `lemonade bench` CLI 工具启动了这一功能,该工具在 llama.cpp、FastFlowLM 和 vLLM 之间收集公平的 LLM 性能数据。
## 跨厂商支持
只有当 Lemonade 在每个平台上都提供出色体验时,它才有最大机会实现推动本地 AI 的使命。v10.7 为 llama.cpp 和 stable-diffusion.cpp 添加了 CUDA 后端,以及为 sd-cpp 添加了 Vulkan 后端,更多功能即将推出。从 v10.7 开始,LMX-Omni 虚拟模型在 AMD、Apple Silicon、Nvidia 和 Intel 系统上实现了 GPU 加速。
## 下一步
你可以在此处查看 [工作组路线图](https://lemonade-server.ai/docs/dev/working-groups/)。如果你喜欢我们的工作,请在此处给我反馈,给仓库加星,并加入 [Lemonade Discord](https://discord.gg/5xXzkMu8Zk) 的双周公开会议!
相似文章
Lemonade 中的 macOS 支持已从 Beta 版毕业!
Lemonade 是一款开源本地 AI 解决方案,其 macOS 支持已从 Beta 版毕业,现在在 macOS 上提供所有主要功能,包括 OmniRouter、编程、图像/语音生成和转录。
@vllm_project: 迎接 vLLM-Omni v0.22.0,全能模态世界模型与生产级多模态服务的重大升级。首发支持 @NVID…
vLLM-Omni v0.22.0 是一项重大升级,新增了对 NVIDIA Cosmos 世界模型、生产级 TTS(Qwen3-TTS、Qwen3-Omni、VoxCPM2)的稳健支持,更快的扩散模型服务(Wan 2.2、HunyuanVideo 1.5、LTX-2.3),以及更广泛的量化和硬件覆盖,共包含来自 124 位贡献者的 339 个提交。
AMD的Lemonade SDK为本地AI添加了NVIDIA CUDA支持
AMD的Lemonade SDK在10.7版本中为本地AI添加了NVIDIA CUDA支持,使得在竞争对手的GPU上也能获得相同的本地AI服务器体验。该版本还引入了lemonade bench,用于跨后端的LLM基准测试,并提供了更广泛的Vulkan支持。
Lemonade v10.5.1:面向Strix Halo的MTP + ROCm 7.13快速入门指南
Lemonade v10.5.1 新增 MTP 支持,为 Strix Halo 提供 ROCm 7.13 快速启动,并修复了 Fedora 43 问题。
vLLM ROCm 已作为实验性后端添加到 Lemonade 中。
Lemonade 为 vLLM 添加了一个实验性的 ROCm 后端,使用户能够通过简单的命令在 AMD GPU 上轻松运行 safetensors 格式的大语言模型。