LiquidAI/LFM2.5-8B-A1B-GGUF

Hugging Face Models Trending 模型

摘要

LiquidAI 发布了其 LFM2.5-8B-A1B 模型的 GGUF 量化版本,并提供了在多个推理引擎上的使用说明。

Task: text-generation Tags: gguf, liquid, lfm2, edge, llama.cpp, text-generation, en, ar, zh, fr, de, ja, ko, es, base_model:LiquidAI/LFM2.5-8B-A1B, base_model:quantized:LiquidAI/LFM2.5-8B-A1B, license:other, endpoints_compatible, region:us, conversational
查看原文
查看缓存全文

缓存时间: 2026/05/29 08:10

LiquidAI/LFM2.5-8B-A1B-GGUF · Hugging Face

来源: https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF

库: llama-cpp-python (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?library=llama-cpp-python)

如何使用 llama-cpp-python 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

``

!pip install llama-cpp-python

from llama_cpp import Llama

llm = Llama.from_pretrained( repo_id=“LiquidAI/LFM2.5-8B-A1B-GGUF”, filename=“LFM2.5-8B-A1B-BF16.gguf”, ) ``

llm.create_chat_completion( messages = [ { "role": "user", "content": "What is the capital of France?" } ] )

Notebooks Google Colab (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF/colab) Kaggle (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF/kaggle)

本地应用 https://huggingface.co/settings/local-apps#local-apps

llama.cpp (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?local-app=llama.cpp)

如何使用 llama.cpp 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

通过 brew 安装

`` brew install llama.cpp

启动一个本地 OpenAI 兼容的服务器,带 Web UI:

llama-server -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M

直接在终端中运行推理:

llama-cli -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M ``

通过 WinGet (Windows) 安装

`` winget install llama.cpp

启动一个本地 OpenAI 兼容的服务器,带 Web UI:

llama-server -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M

直接在终端中运行推理:

llama-cli -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M ``

使用预编译二进制文件

``

从以下地址下载预编译二进制文件:

https://github.com/ggerganov/llama.cpp/releases

启动一个本地 OpenAI 兼容的服务器,带 Web UI:

./llama-server -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M

直接在终端中运行推理:

./llama-cli -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M ``

从源代码构建

`` git clone https://github.com/ggerganov/llama.cpp.git cd llama.cpp cmake -B build cmake –build build -j –target llama-server llama-cli

启动一个本地 OpenAI 兼容的服务器,带 Web UI:

./build/bin/llama-server -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M

直接在终端中运行推理:

./build/bin/llama-cli -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M ``

使用 Docker

docker model run hf.co/LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M

LM Studio Jan

vLLM (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?local-app=vllm)

如何使用 vLLM 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

通过 pip 安装并服务模型

``

通过 pip 安装 vLLM:

pip install vllm

启动 vLLM 服务器:

vllm serve “LiquidAI/LFM2.5-8B-A1B-GGUF”

使用 curl 调用服务器(OpenAI 兼容 API):

curl -X POST “http://localhost:8000/v1/chat/completions”
-H “Content-Type: application/json”
–data ‘{ “model”: “LiquidAI/LFM2.5-8B-A1B-GGUF”, “messages”: [ { “role”: “user”, “content”: “What is the capital of France?” } ] }’ ``

使用 Docker

docker model run hf.co/LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M

Ollama (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?local-app=ollama)

如何使用 Ollama 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

ollama run hf.co/LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M

Unsloth Studio 新增 (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?local-app=unsloth)

如何使用 Unsloth Studio 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

安装 Unsloth Studio(macOS、Linux、WSL)

`` curl -fsSL https://unsloth.ai/install.sh | sh

运行 unsloth studio

unsloth studio -H 0.0.0.0 -p 8888

然后在浏览器中打开 http://localhost:8888

搜索 LiquidAI/LFM2.5-8B-A1B-GGUF 开始聊天

``

安装 Unsloth Studio(Windows)

`` irm https://unsloth.ai/install.ps1 | iex

运行 unsloth studio

unsloth studio -H 0.0.0.0 -p 8888

然后在浏览器中打开 http://localhost:8888

搜索 LiquidAI/LFM2.5-8B-A1B-GGUF 开始聊天

``

使用 HuggingFace Spaces 运行 Unsloth

``

无需设置

在浏览器中打开 https://huggingface.co/spaces/unsloth/studio

搜索 LiquidAI/LFM2.5-8B-A1B-GGUF 开始聊天

``

Pi 新增 (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?local-app=pi)

如何使用 Pi 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

启动 llama.cpp 服务器

``

安装 llama.cpp:

brew install llama.cpp

启动一个本地 OpenAI 兼容的服务器:

llama-server -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M ``

在 Pi 中配置模型

``

安装 Pi:

npm install -g @mariozechner/pi-coding-agent

添加到 ~/.pi/agent/models.json:

{ “providers”: { “llama-cpp”: { “baseUrl”: “http://localhost:8080/v1”, “api”: “openai-completions”, “apiKey”: “none”, “models”: [ { “id”: “LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M” } ] } } } ``

运行 Pi

``

在项目目录中启动 Pi:

pi ``

Hermes Agent 新增 (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?local-app=hermes-agent)

如何使用 Hermes Agent 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

启动 llama.cpp 服务器

``

安装 llama.cpp:

brew install llama.cpp

启动一个本地 OpenAI 兼容的服务器:

llama-server -hf LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M ``

配置 Hermes

``

安装 Hermes:

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash hermes setup

将 Hermes 指向本地服务器:

hermes config set model.provider custom hermes config set model.base_url http://127.0.0.1:8080/v1 hermes config set model.default LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M ``

运行 Hermes

hermes

Docker Model Runner (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?local-app=docker-model-runner)

如何使用 Docker Model Runner 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

docker model run hf.co/LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M

Lemonade (https://huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF?local-app=lemonade)

如何使用 Lemonade 使用 LiquidAI/LFM2.5-8B-A1B-GGUF:

拉取模型

``

从 https://lemonade-server.ai/ 下载 Lemonade

lemonade pull LiquidAI/LFM2.5-8B-A1B-GGUF:Q4_K_M ``

运行并与模型聊天

lemonade run user.LFM2.5-8B-A1B-GGUF-Q4_K_M

列出所有可用模型

lemonade list

相似文章

Liquid AI 发布 LFM2.5-8B-A1B

Reddit r/LocalLLaMA

Liquid AI 发布了 LFM2.5-8B-A1B,这是一款边缘模型,拥有 128K 上下文窗口、38T 预训练 token 和大规模强化学习,支持工具调用和复杂任务,同时可运行于入门级笔记本电脑。