llama.cpp 现在通过API支持模型管理(下载等)
摘要
llama.cpp 现在通过API支持模型管理,包括下载和生命周期管理,无需外部工具即可完全部署。
#23976 在几小时前被合并,这意味着 llama.cpp 现在不仅可以从目录按需加载/卸载模型,还可以按需下载模型。还没有用户界面,但很快就会有了。这意味着你现在可以部署 llama.cpp,暴露API,并仅用它来管理完整生命周期,而无需其他工具。
相似文章
llama.cpp 就是 LLM 界的 Linux
文章把 llama.cpp 比作 Linux,认为这款开源库已成为运行大语言模型的基础底座。
llama : 网站 + 统一的 `llama` 二进制文件 · ggml-org/llama.cpp · 讨论 #23875
Llama.cpp 宣布推出新网站和统一的 'llama' 二进制文件,以简化 LLM 推理,同时还包括 Hugging Face 缓存迁移和多模态支持等更新。
llama.cpp server 现已内置原生工具(exec_shell、edit_file 等)
llama.cpp server 现通过实验性标志内置了原生工具,支持文件操作、shell 命令等功能,无需外部包装器。
运行MTP模型的llama.cpp Docker镜像
提供用于通过 llama.cpp 运行 MTP 模型的 Docker 镜像,包括量化比较和使用说明。
@ggerganov:llama.cpp 现在有了官方网站:https://llama.app 我们的目标是让本地 AI 人人可用,并改善…
llama.cpp,广受欢迎的本地 AI 推理工具,现在有了官方网站(llama.app),提供跨平台安装程序和更好的用户体验,让本地 AI 更易于使用。