@Axel_bitblaze69：Claude code 没有使用限制……是的，你可以通过免费提供商路由……使用这个仓库……每一个 claude code……

X AI KOLs Timeline 2026/05/08 14:21 工具

open-source proxy claude llm api-routing self-hosted developer-tools

摘要

# 一个 GitHub 仓库，可将 Claude Code 的 Anthropic API 调用代理到免费或替代提供商该仓库支持 NVIDIA NIM、OpenRouter、DeepSeek 以及本地模型（Ollama、LM Studio），在保留 Claude Code 界面的同时绕过使用限制。配置仅需约 5 分钟，并支持可选的 Discord/Telegram 机器人封装。

# 不再有使用限制的 Claude Code……是的，你可以通过免费提供商来路由请求使用这个仓库…… 每个 Claude Code 用户都曾碰过这堵墙："usage limit reached, resets at 8:20 PM"，真的很烦——偏偏卡在你正忙着的时候。但现在有一个代理可以彻底解决这个问题……它保留了 Claude Code 本身，只是替换了背后运行的模型。 ## 工作原理 Claude Code 发出 Anthropic API 请求 → 代理在 `localhost:8082` 拦截 → 转换成你所选提供商的格式 → 路由到 NVIDIA NIM、OpenRouter、DeepSeek、LM Studio、llama.cpp 或 Ollama → 以 Anthropic 的格式将响应流式返回。 Claude Code 本身对这一切毫不知情。`/model` 选择器、工具调用、流式传输——全都一样。 ## 配置步骤（5 分钟） 1. 安装 Claude Code、`uv` 和 Python 3.14 2. `git clone https://github.com/Alishahryar1/free-claude-code.git` 3. `cp .env.example .env`，然后填入你的提供商密钥（免费路径用 `NVIDIA_NIM_API_KEY`） 4. 启动代理： ``` uv run uvicorn server:app --host 0.0.0.0 --port 8082 ``` 5. 将 Claude Code 指向代理后启动： ``` ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" claude ``` 就这些。`/model` 现在会列出你的代理能访问的所有模型。 ## 支持的提供商 - **NVIDIA NIM**：免费层级，提供 glm4.7 等模型，云端托管 - **OpenRouter**：按量付费，覆盖数百个模型 - **DeepSeek**：直接兼容 Anthropic 格式的端点 - **LM Studio / llama.cpp / Ollama**：完全本地运行，无需 API 密钥还可以混合搭配：Opus 调用走一个提供商，Sonnet 走另一个，Haiku 走第三个。所有分层路由逻辑都在你的 `.env` 里配置。 ## 额外功能可选的 Discord + Telegram 机器人封装，让你能在手机上运行 Claude Code 会话，还支持通过 Whisper 发送语音消息。在地铁上发起一个编码任务，回来再查看 diff。 --- 在我看来，这是在不产生 Anthropic 账单的情况下继续使用 Claude Code 的最简洁方式。你不是在换工具，只是在重新路由模型。仓库地址：http://github.com/Alishahryar1/free-claude-code

查看原文

查看缓存全文

缓存时间: 2026/05/09 11:48

无使用限制地使用 Claude Code……是的，你可以通过免费提供商来路由……使用这个仓库

每个 Claude Code 用户都会遇到这道坎……“已达到使用限制，将于晚上 8:20 重置”——这真的很烦人……偏偏在你做到一半的时候。但现在有一个代理可以彻底解决这个问题……它保留了 Claude Code 本身，只是替换了背后运行的模型。

工作原理如下：Claude Code 发起 Anthropic API 调用 → 代理在 localhost:8082 拦截请求 → 翻译成你所选提供商能理解的格式 → 路由到 NVIDIA NIM、OpenRouter、DeepSeek、LM Studio、llama.cpp 或 Ollama → 以 Anthropic 格式将响应流式返回。

而且 Claude Code 完全不知道发生了什么变化。同样的 /model 选择器，同样的工具调用，同样的流式传输。

安装步骤（5 分钟）

安装 Claude Code、uv 和 Python 3.14

git clone https://github.com/Alishahryar1/free-claude-code.git

复制 .env.example 为 .env，然后设置你的提供商密钥（免费路径使用 NVIDIA_NIM_API_KEY）

启动代理：

uv run uvicorn server:app --host 0.0.0.0 --port 8082

将 Claude Code 指向代理启动：

ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" claude

就这些。/model 现在会列出你的代理可以访问的所有模型。

提供商选项

NVIDIA NIM：免费套餐，提供 glm4.7 等模型，云端托管
OpenRouter：按量计费，可访问数百个模型
DeepSeek：直接兼容 Anthropic 的端点
LM Studio / llama.cpp / Ollama：完全本地运行，无需 API 密钥

灵活组合：将 Opus 调用发送到一个提供商，Sonnet 发送到另一个，Haiku 发送到第三个。所有按级别路由的配置都在你的 .env 中完成。

额外功能

可选的 Discord + Telegram 机器人封装，让你可以在手机上运行 Claude Code 会话，还支持通过 Whisper 进行语音笔记转录。在路上发起一个编码任务，回来后查看 diff。

个人认为，这是在不产生 Anthropic 账单的情况下继续使用 Claude Code 最干净的方式。你不是在切换工具，只是在重新路由模型。

仓库地址：http://github.com/Alishahryar1/free-claude-code

Alishahryar1/free-claude-code

来源：https://github.com/Alishahryar1/free-claude-code

🤖 Free Claude Code

通过你自己的 Anthropic 兼容代理使用 Claude Code CLI、VS Code、JetBrains ACP 或聊天机器人。

许可证：MIT
Python 3.14
uv
通过 Pytest 测试
类型检查：Ty
代码风格：Ruff
日志：Loguru

Free Claude Code 将 Anthropic Messages API 流量从 Claude Code 路由到 NVIDIA NIM、Kimi、Wafer、OpenRouter、DeepSeek、LM Studio、llama.cpp 或 Ollama。它保持 Claude Code 客户端协议稳定，同时让你自由选择免费、付费或本地模型。

快速开始 · 提供商 · 客户端 · 故障排查 · 开发

Star 历史

你将获得什么

Claude Code Anthropic API 调用的直接替代代理。
八个提供商后端：NVIDIA NIM、Kimi、Wafer、OpenRouter、DeepSeek、LM Studio、llama.cpp 和 Ollama。
按模型路由：将 Opus、Sonnet、Haiku 和兜底流量发送到不同提供商。
通过代理的 /v1/models 端点原生支持 Claude Code /model 选择器（Claude Code 需要开启 Gateway 模型发现；参见模型选择器）。
流式传输、工具调用、推理/思考块处理以及本地请求优化。
可选的 Discord 或 Telegram 机器人封装，用于远程编码会话。
通过本地 Whisper 或 NVIDIA NIM 进行可选语音笔记转录。

快速开始

1. 安装依赖

安装 Claude Code，然后安装 uv 和 Python 3.14。

macOS/Linux：

curl -LsSf https://astral.sh/uv/install.sh | sh
uv self update
uv python install 3.14

Windows PowerShell：

powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
uv self update
uv python install 3.14

2. 克隆并配置

git clone https://github.com/Alishahryar1/free-claude-code.git
cd free-claude-code
cp .env.example .env

编辑 .env 并选择一个提供商。默认 NVIDIA NIM 路径：

NVIDIA_NIM_API_KEY="nvapi-your-key"
MODEL="nvidia_nim/z-ai/glm4.7"
ANTHROPIC_AUTH_TOKEN="freecc"

ANTHROPIC_AUTH_TOKEN 可以使用任意本地密钥；Claude Code 会将相同的值发回给该代理。仅在本地/私有测试时才可留空。

3. 启动代理

uv run uvicorn server:app --host 0.0.0.0 --port 8082

包安装的替代方式：

uv tool install git+https://github.com/Alishahryar1/free-claude-code.git
fcc-init free-claude-code

fcc-init 会从内置模板在 ~/.config/free-claude-code/.env 创建配置文件。

4. 运行 Claude Code

将 ANTHROPIC_BASE_URL 指向代理根目录，不要附加 /v1。如果你使用 /model 列出来自该代理的模型，请设置 CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1（参见模型选择器）。

PowerShell：

$env:ANTHROPIC_AUTH_TOKEN="freecc"; $env:ANTHROPIC_BASE_URL="http://localhost:8082"; $env:CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY="1"; claude

Bash：

ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 claude

选择提供商

模型值使用以下格式：

provider_id/model/name

MODEL 是兜底配置。MODEL_OPUS、MODEL_SONNET 和 MODEL_HAIKU 会覆盖 Claude Code 针对这些层级发送请求时的路由。

提供商	前缀	传输方式	密钥	默认 base URL
NVIDIA NIM	`nvidia_nim/...`	OpenAI chat 翻译	`NVIDIA_NIM_API_KEY`	`https://integrate.api.nvidia.com/v1`
Kimi	`kimi/...`	OpenAI chat 翻译	`KIMI_API_KEY`	`https://api.moonshot.ai/v1`
Wafer	`wafer/...`	Anthropic Messages	`WAFER_API_KEY`	`https://pass.wafer.ai/v1`
OpenRouter	`open_router/...`	Anthropic Messages	`OPENROUTER_API_KEY`	`https://openrouter.ai/api/v1`
DeepSeek	`deepseek/...`	Anthropic Messages	`DEEPSEEK_API_KEY`	`https://api.deepseek.com/anthropic`
LM Studio	`lmstudio/...`	Anthropic Messages	无需	`http://localhost:1234/v1`
llama.cpp	`llamacpp/...`	Anthropic Messages	无需	`http://localhost:8080/v1`
Ollama	`ollama/...`	Anthropic Messages	无需	`http://localhost:11434`

NVIDIA NIM

在 build.nvidia.com/settings/api-keys 获取密钥。

NVIDIA_NIM_API_KEY="nvapi-your-key"
MODEL="nvidia_nim/z-ai/glm4.7"

常用示例：

nvidia_nim/z-ai/glm4.7
nvidia_nim/z-ai/glm5
nvidia_nim/moonshotai/kimi-k2.5
nvidia_nim/minimaxai/minimax-m2.5

在 build.nvidia.com 浏览模型。

Kimi

在 platform.moonshot.ai/console/api-keys 获取密钥。

KIMI_API_KEY="your-kimi-key"
MODEL="kimi/kimi-k2.5"

在 platform.moonshot.ai 浏览模型。

Wafer

从 wafer.ai 获取密钥，然后选择 Wafer Pass 返回的模型：

WAFER_API_KEY="your-wafer-key"
MODEL="wafer/DeepSeek-V4-Pro"

常用示例：

wafer/DeepSeek-V4-Pro
wafer/MiniMax-M2.7
wafer/Qwen3.5-397B-A17B
wafer/GLM-5.1

该提供商使用 Wafer 在 https://pass.wafer.ai/v1/messages 的 Anthropic 兼容端点。

OpenRouter

在 openrouter.ai/keys 获取密钥。

OPENROUTER_API_KEY="sk-or-your-key"
MODEL="open_router/stepfun/step-3.5-flash:free"

浏览所有模型或免费模型。

DeepSeek

在 platform.deepseek.com/api_keys 获取密钥。

DEEPSEEK_API_KEY="your-deepseek-key"
MODEL="deepseek/deepseek-chat"

该提供商使用 DeepSeek 的 Anthropic 兼容端点，而非 OpenAI chat completions 端点。

LM Studio

启动 LM Studio 的本地服务器，加载一个模型，然后配置：

LM_STUDIO_BASE_URL="http://localhost:1234/v1"
MODEL="lmstudio/your-loaded-model"

使用 LM Studio 显示的模型标识符。对于 Claude Code 工作流，优先选择支持工具调用的模型。

llama.cpp

启动带有 Anthropic 兼容 /v1/messages 端点的 llama-server，并为 Claude Code 请求提供足够的上下文。

LLAMACPP_BASE_URL="http://localhost:8080/v1"
MODEL="llamacpp/local-model"

对于本地编码模型，上下文大小很重要。如果 llama.cpp 对正常的 Claude Code 请求返回 HTTP 400，请增大 --ctx-size 并验证模型/服务端构建是否支持所请求的功能。

Ollama

运行 Ollama 并拉取模型：

ollama pull llama3.1
ollama serve

然后配置代理。OLLAMA_BASE_URL 是 Ollama 服务根地址，不要附加 /v1。

OLLAMA_BASE_URL="http://localhost:11434"
MODEL="ollama/llama3.1"

使用 ollama list 显示的相同标签，例如 ollama/llama3.1:8b。

按模型层级混合使用提供商

每个层级可以使用不同的提供商：

NVIDIA_NIM_API_KEY="nvapi-your-key"
OPENROUTER_API_KEY="sk-or-your-key"
WAFER_API_KEY="your-wafer-key"

MODEL_OPUS="nvidia_nim/moonshotai/kimi-k2.5"
MODEL_SONNET="open_router/deepseek/deepseek-r1-0528:free"
MODEL_HAIKU="lmstudio/unsloth/GLM-4.7-Flash-GGUF"
MODEL="wafer/DeepSeek-V4-Pro"

连接 Claude Code

Claude Code CLI

ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 claude

VS Code 扩展

打开设置，搜索 claude-code.environmentVariables，选择在 settings.json 中编辑，并添加：

"claudeCode.environmentVariables": [
  { "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:8082" },
  { "name": "ANTHROPIC_AUTH_TOKEN", "value": "freecc" },
  { "name": "CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY", "value": "1" }
]

重新加载扩展。如果扩展显示登录界面，选择一次 Anthropic Console 路径；环境变量生效后，本地代理仍会处理模型流量。

JetBrains ACP

编辑已安装的 Claude ACP 配置：

Windows：C:\Users\%USERNAME%\AppData\Roaming\JetBrains\acp-agents\installed.json
Linux/macOS：~/.jetbrains/acp.json

为 acp.registry.claude-acp 设置环境：

"env": {
  "ANTHROPIC_BASE_URL": "http://localhost:8082",
  "ANTHROPIC_AUTH_TOKEN": "freecc",
  "CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY": "1"
}

修改文件后重启 IDE。

模型选择器

Claude Code 2.1.126 或更高版本可以在 ANTHROPIC_BASE_URL 指向本代理时，通过 Gateway /v1/models 响应在 /model 中填充模型列表。在 2.1.126–2.1.128 中该发现是自动的；更新的版本需要在与 ANTHROPIC_* 相同的环境中设置 CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1。如果你只通过代理配置设置模型且从不使用 /model 发现，则可以省略该标志。

按照快速开始设置该变量启动 Claude Code，运行 /model，然后选择任意发现的提供商模型。代理会为已配置提供商密钥和引用的本地提供商列出模型。选择器友好的 ID 会自动路由回真实的提供商/模型，因此启动后无需编辑 .env 或使用单独的启动脚本。每个提供商模型还有一个 (no thinking) 选择器变体。当模型不支持 Claude Code 思考功能或自适应思考请求失败时使用它。它会路由到相同的上游模型，同时要求 Claude Code 发送不含思考的请求。

可选集成

Discord 和 Telegram 机器人

机器人封装可远程运行 Claude Code 会话、流式传输进度、支持基于回复的对话分支，并可停止或清除任务。

Discord 最小配置：

MESSAGING_PLATFORM="discord"
DISCORD_BOT_TOKEN="your-discord-bot-token"
ALLOWED_DISCORD_CHANNELS="123456789"
CLAUDE_WORKSPACE="./agent_workspace"
ALLOWED_DIR="C:/Users/yourname/projects"

在 Discord 开发者门户创建机器人，启用消息内容意图，并授予读取/发送/历史权限后邀请机器人。

Telegram 最小配置：

MESSAGING_PLATFORM="telegram"
TELEGRAM_BOT_TOKEN="123456789:ABC..."
ALLOWED_TELEGRAM_USER_ID="your-user-id"
CLAUDE_WORKSPACE="./agent_workspace"
ALLOWED_DIR="C:/Users/yourname/projects"

从 @BotFather 获取 token，从 @userinfobot 获取你的用户 ID。

常用命令：

/stop 取消任务；回复某条任务消息可仅停止该分支。
/clear 重置会话；回复可清除单个分支。
/stats 显示会话状态。

语音笔记

语音笔记适用于 Discord 和 Telegram。选择一个后端：

uv sync --extra voice_local
uv sync --extra voice
uv sync --extra voice --extra voice_local

VOICE_NOTE_ENABLED=true
WHISPER_DEVICE="cpu"        # cpu | cuda | nvidia_nim
WHISPER_MODEL="base"
HF_TOKEN=""

配合 voice 扩展和 NVIDIA_NIM_API_KEY 使用 WHISPER_DEVICE="nvidia_nim" 可进行 NVIDIA 云端转录。

配置参考

.env.example 是所有变量的权威列表。以下部分是大多数用户最常修改的内容。

模型路由

MODEL="nvidia_nim/z-ai/glm4.7"
MODEL_OPUS=
MODEL_SONNET=
MODEL_HAIKU=

ENABLE_MODEL_THINKING=true
ENABLE_OPUS_THINKING=
ENABLE_SONNET_THINKING=
ENABLE_HAIKU_THINKING=

空白的按层级值会继承兜底配置。空白的思考覆盖会继承 ENABLE_MODEL_THINKING。

提供商密钥和 URL

NVIDIA_NIM_API_KEY=""
OPENROUTER_API_KEY=""
DEEPSEEK_API_KEY=""
WAFER_API_KEY=""

LM_STUDIO_BASE_URL="http://localhost:1234/v1"
LLAMACPP_BASE_URL="http://localhost:8080/v1"
OLLAMA_BASE_URL="http://localhost:11434"

代理设置按提供商配置：

NVIDIA_NIM_PROXY=""
OPENROUTER_PROXY=""
LMSTUDIO_PROXY=""
LLAMACPP_PROXY=""
WAFER_PROXY=""

频率限制和超时

PROVIDER_RATE_LIMIT=1
PROVIDER_RATE_WINDOW=3
PROVIDER_MAX_CONCURRENCY=5
HTTP_READ_TIMEOUT=120
HTTP_WRITE_TIMEOUT=10
HTTP_CONNECT_TIMEOUT=10

对免费托管提供商使用较低限制；如果机器性能允许，本地提供商通常可以承受更高并发。

安全与诊断

ANTHROPIC_AUTH_TOKEN=
LOG_RAW_API_PAYLOADS=false
LOG_RAW_SSE_EVENTS=false
LOG_API_ERROR_TRACEBACKS=false
LOG_RAW_MESSAGING_CONTENT=false
LOG_RAW_CLI_DIAGNOSTICS=false
LOG_MESSAGING_ERROR_DETAILS=false

原始日志标志可能暴露提示词、工具参数、路径和模型输出。除非在本地调试，否则请保持关闭。

本地 Web 工具

ENABLE_WEB_SERVER_TOOLS=true
WEB_FETCH_ALLOWED_SCHEMES=http,https
WEB_FETCH_ALLOW_PRIVATE_NETWORKS=false

这些工具会从代理发出出站 HTTP 请求。除非在受控实验环境中，否则请禁用私有网络访问。

故障排查

Claude Code 报告 `undefined ... input_tokens`、`$.speed` 或响应格式错误

首先更新到最新提交。旧版本可能在流式响应中输出无效的使用元数据。然后检查：

ANTHROPIC_BASE_URL 是 http://localhost:8082，而非 http://localhost:8082/v1。
代理正在为 /v1/messages 返回 Server-Sent Events。
server.log 在格式错误响应出现之前没有上游 400/500 响应。

llama.cpp 或 LM Studio 返回 HTTP 400

这通常意味着本地运行时在代理流式返回模型答案之前就拒绝了 Anthropic Messages 请求。检查：

本地服务器支持 POST /v1/messages。
模型和运行时支持所请求的上下文长度和工具。
llama.cpp 启动时 --ctx-size 对 Claude Code 提示词来说足够大。
LM Studio 和 llama.cpp 的配置 base URL 包含 /v1。

提供商连接中断

相似文章

Claude Code现在免费运行。无限。无需订阅 🤯

Reddit r/AI_Agents

一个开源工具（free-claude-code）允许通过使用NVIDIA NIM API的代理免费且无需订阅使用Claude Code，每分钟40次请求。它支持多种模型，并包含一个Telegram机器人。

@pritipatelfgoo: Claude Code 永久免费用！这个开源神器 free-claude-code 通过把流量代理到 DeepSeek、Kimi、NVIDIA NIM、OpenRouter、Ollama 本地模型等 10+ 免费/本地后端，实现0费用使…

X AI KOLs Timeline

free-claude-code 是一个开源工具，通过将 Claude Code 的流量代理到 DeepSeek、Kimi、Ollama 等10多个免费或本地后端，实现永久免费使用 Claude Code，支持 CLI、VSCode、JetBrains 和 Discord。

再次使用Claude Code订阅为OpenClaw服务！

Reddit r/openclaw

一位开发者创建了otterly，这是一个npm包，可将本地Claude CLI转换为兼容OpenAI的HTTP服务器，使OpenClaw等应用程序能够使用Claude Code订阅，而不是昂贵的按token付费API费率。该工具可在树莓派上运行，并共享Claude Code的速率限制。

Claude Code 还未消失！