Lemonade v10.7 发布及项目组织更新

Reddit r/LocalLLaMA 2026/06/10 16:19 工具

release local-ai open-source llama.cpp vllm performance cross-platform

摘要

Lemonade v10.7 版本引入了 LMX-Omni 虚拟模型，支持全模态聊天；新增 bench CLI 工具，用于跨后端比较 LLM 性能；并扩展了在 AMD、Apple Silicon、Nvidia 和 Intel 系统上的 GPU 支持。

今天的 [v10.7 发布](https://github.com/lemonade-sdk/lemonade/releases/tag/v10.7.0) 标志着 Lemonade 项目一个激动人心的新篇章的开始，因此我想分享一个项目层面的更新。Lemonade 的路线图和开发现在由 6 个 [工作组](https://lemonade-server.ai/docs/dev/working-groups/) 推动，其中 4 个由非 AMD 员工领导。以下是 v10.7 版本中来自 3 个工作组的亮点，该版本共有 19 位贡献者。 ## 本地全模态模型真正的全模态聊天，包括图像生成/编辑，通过无缝组合多个后端和模型实现。v10.7 使这些 [LMX-Omni](https://huggingface.co/lemonade-sdk/LMX-Omni-52B-Halo) 虚拟模型与 Open WebUI 及其他支持多媒体渲染的 OpenAI 客户端兼容。 ## 自动调优每个系统都应获得最佳性能，用户无需担心优化标志。v10.7 通过添加 `lemonade bench` CLI 工具启动了这一功能，该工具在 llama.cpp、FastFlowLM 和 vLLM 之间收集公平的 LLM 性能数据。 ## 跨厂商支持只有当 Lemonade 在每个平台上都提供出色体验时，它才有最大机会实现推动本地 AI 的使命。v10.7 为 llama.cpp 和 stable-diffusion.cpp 添加了 CUDA 后端，以及为 sd-cpp 添加了 Vulkan 后端，更多功能即将推出。从 v10.7 开始，LMX-Omni 虚拟模型在 AMD、Apple Silicon、Nvidia 和 Intel 系统上实现了 GPU 加速。 ## 下一步你可以在此处查看 [工作组路线图](https://lemonade-server.ai/docs/dev/working-groups/)。如果你喜欢我们的工作，请在此处给我反馈，给仓库加星，并加入 [Lemonade Discord](https://discord.gg/5xXzkMu8Zk) 的双周公开会议！

查看原文

Lemonade v10.7 发布及项目组织更新

相似文章

Lemonade 中的 macOS 支持已从 Beta 版毕业！

@vllm_project: 迎接 vLLM-Omni v0.22.0，全能模态世界模型与生产级多模态服务的重大升级。首发支持 @NVID…

AMD的Lemonade SDK为本地AI添加了NVIDIA CUDA支持

Lemonade v10.5.1：面向Strix Halo的MTP + ROCm 7.13快速入门指南

vLLM ROCm 已作为实验性后端添加到 Lemonade 中。

提交意见反馈