@Axel_bitblaze69:Claude code 没有使用限制……是的,你可以通过免费提供商路由……使用这个仓库……每一个 claude code……
摘要
# 一个 GitHub 仓库,可将 Claude Code 的 Anthropic API 调用代理到免费或替代提供商 该仓库支持 NVIDIA NIM、OpenRouter、DeepSeek 以及本地模型(Ollama、LM Studio),在保留 Claude Code 界面的同时绕过使用限制。配置仅需约 5 分钟,并支持可选的 Discord/Telegram 机器人封装。
查看缓存全文
缓存时间: 2026/05/09 11:48
无使用限制地使用 Claude Code……是的,你可以通过免费提供商来路由……使用这个仓库
每个 Claude Code 用户都会遇到这道坎……“已达到使用限制,将于晚上 8:20 重置”——这真的很烦人……偏偏在你做到一半的时候。但现在有一个代理可以彻底解决这个问题……它保留了 Claude Code 本身,只是替换了背后运行的模型。
工作原理如下:Claude Code 发起 Anthropic API 调用 → 代理在 localhost:8082 拦截请求 → 翻译成你所选提供商能理解的格式 → 路由到 NVIDIA NIM、OpenRouter、DeepSeek、LM Studio、llama.cpp 或 Ollama → 以 Anthropic 格式将响应流式返回。
而且 Claude Code 完全不知道发生了什么变化。同样的 /model 选择器,同样的工具调用,同样的流式传输。
安装步骤(5 分钟)
安装 Claude Code、uv 和 Python 3.14
git clone https://github.com/Alishahryar1/free-claude-code.git
复制 .env.example 为 .env,然后设置你的提供商密钥(免费路径使用 NVIDIA_NIM_API_KEY)
启动代理:
uv run uvicorn server:app --host 0.0.0.0 --port 8082
将 Claude Code 指向代理启动:
ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" claude
就这些。/model 现在会列出你的代理可以访问的所有模型。
提供商选项
- NVIDIA NIM:免费套餐,提供 glm4.7 等模型,云端托管
- OpenRouter:按量计费,可访问数百个模型
- DeepSeek:直接兼容 Anthropic 的端点
- LM Studio / llama.cpp / Ollama:完全本地运行,无需 API 密钥
灵活组合:将 Opus 调用发送到一个提供商,Sonnet 发送到另一个,Haiku 发送到第三个。所有按级别路由的配置都在你的 .env 中完成。
额外功能
可选的 Discord + Telegram 机器人封装,让你可以在手机上运行 Claude Code 会话,还支持通过 Whisper 进行语音笔记转录。在路上发起一个编码任务,回来后查看 diff。
个人认为,这是在不产生 Anthropic 账单的情况下继续使用 Claude Code 最干净的方式。你不是在切换工具,只是在重新路由模型。
仓库地址:http://github.com/Alishahryar1/free-claude-code
Alishahryar1/free-claude-code
来源:https://github.com/Alishahryar1/free-claude-code
🤖 Free Claude Code
通过你自己的 Anthropic 兼容代理使用 Claude Code CLI、VS Code、JetBrains ACP 或聊天机器人。
许可证:MIT
Python 3.14
uv
通过 Pytest 测试
类型检查:Ty
代码风格:Ruff
日志:Loguru
Free Claude Code 将 Anthropic Messages API 流量从 Claude Code 路由到 NVIDIA NIM、Kimi、Wafer、OpenRouter、DeepSeek、LM Studio、llama.cpp 或 Ollama。它保持 Claude Code 客户端协议稳定,同时让你自由选择免费、付费或本地模型。
Star 历史
你将获得什么
- Claude Code Anthropic API 调用的直接替代代理。
- 八个提供商后端:NVIDIA NIM、Kimi、Wafer、OpenRouter、DeepSeek、LM Studio、llama.cpp 和 Ollama。
- 按模型路由:将 Opus、Sonnet、Haiku 和兜底流量发送到不同提供商。
- 通过代理的
/v1/models端点原生支持 Claude Code/model选择器(Claude Code 需要开启 Gateway 模型发现;参见模型选择器)。 - 流式传输、工具调用、推理/思考块处理以及本地请求优化。
- 可选的 Discord 或 Telegram 机器人封装,用于远程编码会话。
- 通过本地 Whisper 或 NVIDIA NIM 进行可选语音笔记转录。
快速开始
1. 安装依赖
安装 Claude Code,然后安装 uv 和 Python 3.14。
macOS/Linux:
curl -LsSf https://astral.sh/uv/install.sh | sh
uv self update
uv python install 3.14
Windows PowerShell:
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
uv self update
uv python install 3.14
2. 克隆并配置
git clone https://github.com/Alishahryar1/free-claude-code.git
cd free-claude-code
cp .env.example .env
编辑 .env 并选择一个提供商。默认 NVIDIA NIM 路径:
NVIDIA_NIM_API_KEY="nvapi-your-key"
MODEL="nvidia_nim/z-ai/glm4.7"
ANTHROPIC_AUTH_TOKEN="freecc"
ANTHROPIC_AUTH_TOKEN 可以使用任意本地密钥;Claude Code 会将相同的值发回给该代理。仅在本地/私有测试时才可留空。
3. 启动代理
uv run uvicorn server:app --host 0.0.0.0 --port 8082
包安装的替代方式:
uv tool install git+https://github.com/Alishahryar1/free-claude-code.git
fcc-init free-claude-code
fcc-init 会从内置模板在 ~/.config/free-claude-code/.env 创建配置文件。
4. 运行 Claude Code
将 ANTHROPIC_BASE_URL 指向代理根目录,不要附加 /v1。如果你使用 /model 列出来自该代理的模型,请设置 CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1(参见模型选择器)。
PowerShell:
$env:ANTHROPIC_AUTH_TOKEN="freecc"; $env:ANTHROPIC_BASE_URL="http://localhost:8082"; $env:CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY="1"; claude
Bash:
ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 claude
选择提供商
模型值使用以下格式:
provider_id/model/name
MODEL 是兜底配置。MODEL_OPUS、MODEL_SONNET 和 MODEL_HAIKU 会覆盖 Claude Code 针对这些层级发送请求时的路由。
| 提供商 | 前缀 | 传输方式 | 密钥 | 默认 base URL |
|---|---|---|---|---|
| NVIDIA NIM | nvidia_nim/... | OpenAI chat 翻译 | NVIDIA_NIM_API_KEY | https://integrate.api.nvidia.com/v1 |
| Kimi | kimi/... | OpenAI chat 翻译 | KIMI_API_KEY | https://api.moonshot.ai/v1 |
| Wafer | wafer/... | Anthropic Messages | WAFER_API_KEY | https://pass.wafer.ai/v1 |
| OpenRouter | open_router/... | Anthropic Messages | OPENROUTER_API_KEY | https://openrouter.ai/api/v1 |
| DeepSeek | deepseek/... | Anthropic Messages | DEEPSEEK_API_KEY | https://api.deepseek.com/anthropic |
| LM Studio | lmstudio/... | Anthropic Messages | 无需 | http://localhost:1234/v1 |
| llama.cpp | llamacpp/... | Anthropic Messages | 无需 | http://localhost:8080/v1 |
| Ollama | ollama/... | Anthropic Messages | 无需 | http://localhost:11434 |
NVIDIA NIM
在 build.nvidia.com/settings/api-keys 获取密钥。
NVIDIA_NIM_API_KEY="nvapi-your-key"
MODEL="nvidia_nim/z-ai/glm4.7"
常用示例:
nvidia_nim/z-ai/glm4.7nvidia_nim/z-ai/glm5nvidia_nim/moonshotai/kimi-k2.5nvidia_nim/minimaxai/minimax-m2.5
在 build.nvidia.com 浏览模型。
Kimi
在 platform.moonshot.ai/console/api-keys 获取密钥。
KIMI_API_KEY="your-kimi-key"
MODEL="kimi/kimi-k2.5"
在 platform.moonshot.ai 浏览模型。
Wafer
从 wafer.ai 获取密钥,然后选择 Wafer Pass 返回的模型:
WAFER_API_KEY="your-wafer-key"
MODEL="wafer/DeepSeek-V4-Pro"
常用示例:
wafer/DeepSeek-V4-Prowafer/MiniMax-M2.7wafer/Qwen3.5-397B-A17Bwafer/GLM-5.1
该提供商使用 Wafer 在 https://pass.wafer.ai/v1/messages 的 Anthropic 兼容端点。
OpenRouter
在 openrouter.ai/keys 获取密钥。
OPENROUTER_API_KEY="sk-or-your-key"
MODEL="open_router/stepfun/step-3.5-flash:free"
DeepSeek
在 platform.deepseek.com/api_keys 获取密钥。
DEEPSEEK_API_KEY="your-deepseek-key"
MODEL="deepseek/deepseek-chat"
该提供商使用 DeepSeek 的 Anthropic 兼容端点,而非 OpenAI chat completions 端点。
LM Studio
启动 LM Studio 的本地服务器,加载一个模型,然后配置:
LM_STUDIO_BASE_URL="http://localhost:1234/v1"
MODEL="lmstudio/your-loaded-model"
使用 LM Studio 显示的模型标识符。对于 Claude Code 工作流,优先选择支持工具调用的模型。
llama.cpp
启动带有 Anthropic 兼容 /v1/messages 端点的 llama-server,并为 Claude Code 请求提供足够的上下文。
LLAMACPP_BASE_URL="http://localhost:8080/v1"
MODEL="llamacpp/local-model"
对于本地编码模型,上下文大小很重要。如果 llama.cpp 对正常的 Claude Code 请求返回 HTTP 400,请增大 --ctx-size 并验证模型/服务端构建是否支持所请求的功能。
Ollama
运行 Ollama 并拉取模型:
ollama pull llama3.1
ollama serve
然后配置代理。OLLAMA_BASE_URL 是 Ollama 服务根地址,不要附加 /v1。
OLLAMA_BASE_URL="http://localhost:11434"
MODEL="ollama/llama3.1"
使用 ollama list 显示的相同标签,例如 ollama/llama3.1:8b。
按模型层级混合使用提供商
每个层级可以使用不同的提供商:
NVIDIA_NIM_API_KEY="nvapi-your-key"
OPENROUTER_API_KEY="sk-or-your-key"
WAFER_API_KEY="your-wafer-key"
MODEL_OPUS="nvidia_nim/moonshotai/kimi-k2.5"
MODEL_SONNET="open_router/deepseek/deepseek-r1-0528:free"
MODEL_HAIKU="lmstudio/unsloth/GLM-4.7-Flash-GGUF"
MODEL="wafer/DeepSeek-V4-Pro"
连接 Claude Code
Claude Code CLI
ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 claude
VS Code 扩展
打开设置,搜索 claude-code.environmentVariables,选择在 settings.json 中编辑,并添加:
"claudeCode.environmentVariables": [
{ "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:8082" },
{ "name": "ANTHROPIC_AUTH_TOKEN", "value": "freecc" },
{ "name": "CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY", "value": "1" }
]
重新加载扩展。如果扩展显示登录界面,选择一次 Anthropic Console 路径;环境变量生效后,本地代理仍会处理模型流量。
JetBrains ACP
编辑已安装的 Claude ACP 配置:
- Windows:
C:\Users\%USERNAME%\AppData\Roaming\JetBrains\acp-agents\installed.json - Linux/macOS:
~/.jetbrains/acp.json
为 acp.registry.claude-acp 设置环境:
"env": {
"ANTHROPIC_BASE_URL": "http://localhost:8082",
"ANTHROPIC_AUTH_TOKEN": "freecc",
"CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY": "1"
}
修改文件后重启 IDE。
模型选择器
Claude Code 2.1.126 或更高版本可以在 ANTHROPIC_BASE_URL 指向本代理时,通过 Gateway /v1/models 响应在 /model 中填充模型列表。在 2.1.126–2.1.128 中该发现是自动的;更新的版本需要在与 ANTHROPIC_* 相同的环境中设置 CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1。如果你只通过代理配置设置模型且从不使用 /model 发现,则可以省略该标志。
按照快速开始设置该变量启动 Claude Code,运行 /model,然后选择任意发现的提供商模型。代理会为已配置提供商密钥和引用的本地提供商列出模型。选择器友好的 ID 会自动路由回真实的提供商/模型,因此启动后无需编辑 .env 或使用单独的启动脚本。每个提供商模型还有一个 (no thinking) 选择器变体。当模型不支持 Claude Code 思考功能或自适应思考请求失败时使用它。它会路由到相同的上游模型,同时要求 Claude Code 发送不含思考的请求。
可选集成
Discord 和 Telegram 机器人
机器人封装可远程运行 Claude Code 会话、流式传输进度、支持基于回复的对话分支,并可停止或清除任务。
Discord 最小配置:
MESSAGING_PLATFORM="discord"
DISCORD_BOT_TOKEN="your-discord-bot-token"
ALLOWED_DISCORD_CHANNELS="123456789"
CLAUDE_WORKSPACE="./agent_workspace"
ALLOWED_DIR="C:/Users/yourname/projects"
在 Discord 开发者门户创建机器人,启用消息内容意图,并授予读取/发送/历史权限后邀请机器人。
Telegram 最小配置:
MESSAGING_PLATFORM="telegram"
TELEGRAM_BOT_TOKEN="123456789:ABC..."
ALLOWED_TELEGRAM_USER_ID="your-user-id"
CLAUDE_WORKSPACE="./agent_workspace"
ALLOWED_DIR="C:/Users/yourname/projects"
从 @BotFather 获取 token,从 @userinfobot 获取你的用户 ID。
常用命令:
/stop取消任务;回复某条任务消息可仅停止该分支。/clear重置会话;回复可清除单个分支。/stats显示会话状态。
语音笔记
语音笔记适用于 Discord 和 Telegram。选择一个后端:
uv sync --extra voice_local
uv sync --extra voice
uv sync --extra voice --extra voice_local
VOICE_NOTE_ENABLED=true
WHISPER_DEVICE="cpu" # cpu | cuda | nvidia_nim
WHISPER_MODEL="base"
HF_TOKEN=""
配合 voice 扩展和 NVIDIA_NIM_API_KEY 使用 WHISPER_DEVICE="nvidia_nim" 可进行 NVIDIA 云端转录。
配置参考
.env.example 是所有变量的权威列表。以下部分是大多数用户最常修改的内容。
模型路由
MODEL="nvidia_nim/z-ai/glm4.7"
MODEL_OPUS=
MODEL_SONNET=
MODEL_HAIKU=
ENABLE_MODEL_THINKING=true
ENABLE_OPUS_THINKING=
ENABLE_SONNET_THINKING=
ENABLE_HAIKU_THINKING=
空白的按层级值会继承兜底配置。空白的思考覆盖会继承 ENABLE_MODEL_THINKING。
提供商密钥和 URL
NVIDIA_NIM_API_KEY=""
OPENROUTER_API_KEY=""
DEEPSEEK_API_KEY=""
WAFER_API_KEY=""
LM_STUDIO_BASE_URL="http://localhost:1234/v1"
LLAMACPP_BASE_URL="http://localhost:8080/v1"
OLLAMA_BASE_URL="http://localhost:11434"
代理设置按提供商配置:
NVIDIA_NIM_PROXY=""
OPENROUTER_PROXY=""
LMSTUDIO_PROXY=""
LLAMACPP_PROXY=""
WAFER_PROXY=""
频率限制和超时
PROVIDER_RATE_LIMIT=1
PROVIDER_RATE_WINDOW=3
PROVIDER_MAX_CONCURRENCY=5
HTTP_READ_TIMEOUT=120
HTTP_WRITE_TIMEOUT=10
HTTP_CONNECT_TIMEOUT=10
对免费托管提供商使用较低限制;如果机器性能允许,本地提供商通常可以承受更高并发。
安全与诊断
ANTHROPIC_AUTH_TOKEN=
LOG_RAW_API_PAYLOADS=false
LOG_RAW_SSE_EVENTS=false
LOG_API_ERROR_TRACEBACKS=false
LOG_RAW_MESSAGING_CONTENT=false
LOG_RAW_CLI_DIAGNOSTICS=false
LOG_MESSAGING_ERROR_DETAILS=false
原始日志标志可能暴露提示词、工具参数、路径和模型输出。除非在本地调试,否则请保持关闭。
本地 Web 工具
ENABLE_WEB_SERVER_TOOLS=true
WEB_FETCH_ALLOWED_SCHEMES=http,https
WEB_FETCH_ALLOW_PRIVATE_NETWORKS=false
这些工具会从代理发出出站 HTTP 请求。除非在受控实验环境中,否则请禁用私有网络访问。
故障排查
Claude Code 报告 undefined ... input_tokens、$.speed 或响应格式错误
首先更新到最新提交。旧版本可能在流式响应中输出无效的使用元数据。然后检查:
ANTHROPIC_BASE_URL是http://localhost:8082,而非http://localhost:8082/v1。- 代理正在为
/v1/messages返回 Server-Sent Events。 server.log在格式错误响应出现之前没有上游 400/500 响应。
llama.cpp 或 LM Studio 返回 HTTP 400
这通常意味着本地运行时在代理流式返回模型答案之前就拒绝了 Anthropic Messages 请求。检查:
- 本地服务器支持
POST /v1/messages。 - 模型和运行时支持所请求的上下文长度和工具。
- llama.cpp 启动时
--ctx-size对 Claude Code 提示词来说足够大。 - LM Studio 和 llama.cpp 的配置 base URL 包含
/v1。
提供商连接中断
相似文章
Claude Code现在免费运行。无限。无需订阅 🤯
一个开源工具(free-claude-code)允许通过使用NVIDIA NIM API的代理免费且无需订阅使用Claude Code,每分钟40次请求。它支持多种模型,并包含一个Telegram机器人。
@pritipatelfgoo: Claude Code 永久免费用! 这个开源神器 free-claude-code 通过把流量代理到 DeepSeek、Kimi、NVIDIA NIM、OpenRouter、Ollama 本地模型等 10+ 免费/本地后端,实现0费用使…
free-claude-code 是一个开源工具,通过将 Claude Code 的流量代理到 DeepSeek、Kimi、Ollama 等10多个免费或本地后端,实现永久免费使用 Claude Code,支持 CLI、VSCode、JetBrains 和 Discord。
再次使用Claude Code订阅为OpenClaw服务!
一位开发者创建了otterly,这是一个npm包,可将本地Claude CLI转换为兼容OpenAI的HTTP服务器,使OpenClaw等应用程序能够使用Claude Code订阅,而不是昂贵的按token付费API费率。该工具可在树莓派上运行,并共享Claude Code的速率限制。
Claude Code 还未消失!
Anthropic 已撤销了原计划对 Claude Agent SDK 和 claude -p 使用订阅额度限制的规定,称需要根据用户反馈更新计划。
@queen_nunaa: 有人已经在 GitHub 上弄了个仓库,能让你免费、永久地用上 Claude Code。 做法就是把 Claude Code 的请求转发到 10 个免费的服务商,比如 DeepSeek、Kimi 这些。 整个配置过程也就五分钟左右,现在已…
有人在GitHub上创建了一个仓库,通过将Claude Code的请求转发到DeepSeek、Kimi等10个免费服务商,让用户免费且永久地使用Claude Code,配置只需五分钟,已有超过两万开发者使用。