我制作了一款用于在 WSL/Ubuntu 中管理 llama.cpp 的 Windows 应用
摘要
llama.cpp Console 是一款 Windows 桌面应用,提供图形界面来管理 WSL/Ubuntu 中的 llama.cpp,涵盖安装、构建、模型下载和服务部署。
我是 Windows 用户,对软件有着比较典型的 Windows 式期待:我不希望仅仅为了安装、构建、配置和运行程序而整天待在终端里。我找不到一款能按照我的方式管理完整的 llama.cpp-on-WSL 工作流的应用,所以我编写了一个。
llama.cpp Console 是一款非官方的 Windows 桌面应用,用于通过 Ubuntu/WSL 设置和运行 llama.cpp 模型。该 Windows 应用本身是一个独立的 WPF 应用,通过用户界面帮助管理 WSL 端。
**GitHub:** [https://github.com/alekk89/llama.cpp-Console](https://github.com/alekk89/llama.cpp-Console)
**它可以通过用户界面执行以下操作:**
- 检测/安装 WSL 并指导 Ubuntu 设置
- 在 Ubuntu 内安装/更新 CPU 构建工具
- 在 WSL 内安装/更新 CUDA 工具包支持
- 安装/更新 Vulkan 构建依赖
- 从官方仓库或自定义仓库下载 llama.cpp 源代码
- 在 WSL 内构建 CPU、CUDA 或 Vulkan 版本的 llama.cpp 运行时
- 在 Hugging Face 搜索 GGUF 模型
- 下载/注册模型,包括一些兼容性提示以及配套的 projector/mmproj 处理
- 为每个模型设置启动参数
- 选择每个模型应使用的 llama.cpp 运行时/构建版本
- 启动、停止和监督 llama-server
- 实时监控 tokens、运行时指标、日志、GPU 状态、利用率和温度
- 跟踪日志、任务、下载和生命周期指标
- 从应用中管理本地 OpenCode 的模型/提供商/代理配置片段,以便快速将配置好的模型添加到 OpenCode
我构建它的主要原因是我希望那些枯燥的设置工作能更像普通的 Windows 软件——只需在用户界面中点选,查看已安装的内容,查看缺少的部分,构建运行时,下载模型,选择启动设置,然后运行,同时仍能完全掌控整个过程。
**几点说明:**
- 这是一款以 Windows 为主的应用。实际的 llama.cpp 运行时在 Ubuntu/WSL 中运行。
- 模型服务默认仅限本地。
- 目前该应用一次只专注于一个已激活的模型服务。
- 第一个公开发布版本未签名,因此 Windows SmartScreen 可能会发出警告。发布包中包含 SHA-256 文件。
- 此应用与 llama.cpp 或 ggml-org 无关联,也未获得其认可。
我在本地使用了一个较简单的版本一段时间,然后进行了充分的打磨以发布,希望能对其他 Windows 用户有所帮助。
未来的计划工作包括更快的模型切换、在可能的情况下将模型保持在 RAM 中预热,以及最终支持同时加载多个模型。
请注意,我没有 AMD GPU,因此 Vulkan 安装/构建路径并未在 AMD 硬件上经过我的验证。
相似文章
LlamaStation v0.9——面向Windows的llama.cpp图形界面,支持多后端、TurboQuant、MTP等
LlamaStation v0.9 是 llama.cpp 的 Windows 图形界面,提供简洁的界面和完整的参数控制,支持多个后端(官方、TurboQuant、AtomicChat、BeeLlama),实时显存监控、模型专属配置文件、语音模式和无头模式,所有这些都不需要像 Ollama 这样的中间层。
llama.cpp 就是 LLM 界的 Linux
文章把 llama.cpp 比作 Linux,认为这款开源库已成为运行大语言模型的基础底座。
为llama.cpp制作了一个简单的模板管理器与图形界面,这样我就不用一直记住命令行参数了。
Hexllama 是一款免费、开源的桌面图形界面和模板管理器,专为 llama.cpp 设计,简化了命令行参数管理、版本更新以及 HF 模型下载,支持多模型运行。
我发布了一款Windows桌面应用,用于运行本地LLM,其按钮可将你的“不对,错了”转为实际的LoRA训练数据
一款名为SEELS的Windows桌面应用,允许用户运行本地LLM、纠正模型回复,并自动从纠正中训练LoRA适配器。它集成了语音模式、硬件仪表盘和训练伴生程序。
llama.cpp server 现已内置原生工具(exec_shell、edit_file 等)
llama.cpp server 现通过实验性标志内置了原生工具,支持文件操作、shell 命令等功能,无需外部包装器。