Show HN: Lowfat – 可插拔的CLI过滤器,为我省下了91.8%的LLM令牌
摘要
Lowfat是一个轻量级的CLI过滤器,通过在被代理工具接收前剔除不必要的输出来降低AI令牌成本,声称可节省高达91.8%的令牌。它提供Shell集成、插件支持,以及针对Claude Code和OpenCode等工具的透明重写功能。
查看缓存全文
缓存时间: 2026/06/05 14:08
zdk/lowfat
源码: https://github.com/zdk/lowfat
lowfat 是一个轻量级 CLI 工具,通过过滤到达智能体之前的不必要 CLI 输出来降低 AI token 成本。
核心特色
- 轻量级 — 单个小型二进制文件,核心小巧但可扩展。
- 本地优先 — 无遥测;你的数据归你所有。
- 可组合 — UNIX 风格管道,混合内建和你自己的过滤器,不搞黑魔法。
- 用户自主 —
lowfat history展示你运行最多的命令,让你根据使用场景自定义。
安装
cargo install lowfat
# 或者
brew install zdk/tools/lowfat
GitHub Releases 提供预编译二进制文件 (https://github.com/zdk/lowfat/releases)。
配置
任选其一:
Claude Code hook — 添加到 .claude/settings.json:
{
"hooks": {
"PreToolUse": [
{
"matcher": "Bash",
"hooks": [{ "type": "command", "command": "lowfat hook" }]
}
]
}
}
Shell 集成 — 在智能体环境中自动激活 (CLAUDECODE=1, CODEX_ENV),或设置 LOWFAT_ENABLE=1 以在任何 shell 中强制启用:
echo 'eval "$(lowfat shell-init zsh)"' >> ~/.zshrc
# 或者 ~/.bashrc
OpenCode 插件 — 一条命令,无需编辑配置:
lowfat opencode install
# 写入 ~/.config/opencode/plugins/lowfat.ts
重启 OpenCode;命令会在运行前透明地重写。随时用 lowfat opencode uninstall 移除。
直接使用 — 在任何命令前添加前缀:
lowfat git status
lowfat docker ps
lowfat ls -la
Pi agent — 在 ~/.pi/agent/settings.json 中:
{
"shellCommandPrefix": "eval \"$(lowfat shell-init zsh)\"; "
}
使用要点
# 查看配置及每个过滤器的活跃程度
lowfat info
# 状态徽标 + 活跃过滤器
lowfat info git
# 适用于 `git` 的管道
lowfat info --config
# 完整解析后的配置
# 查看 lowfat 为你节省了多少
lowfat stats
# 累计 token 节省量
lowfat stats --audit
# 最近的插件执行记录
lowfat history
# 按潜在节省量排序的命令排名
# 调整过滤激进程度
lowfat level ultra
# 最大压缩
LOWFAT_LEVEL=lite lowfat git log
# 一次性覆盖
# 编写一个插件
lowfat plugin new terraform
# 生成脚手架 ~/.lowfat/plugins/terraform/
lowfat plugin doctor
# 检查插件(并预安装任何 Python 依赖)
# 在不安装的情况下用样本测试插件
cat samples/git-diff-full.txt | lowfat filter --explain ./filter.lf --sub=diff --level=ultra
了解更多
- docs/ARCHITECTURE.md — 高层架构图:CLI、Runner、Plugins、Builtins
- docs/CONFIG.md —
.lowfat文件、环境变量、管道 DSL、内建处理器、history排名 - docs/PLUGINS.md — lf-filter(
.lf插件 DSL)、shell 转义逃生口、PEP 723 + uv、AI 代理提示词
替代品
- rtk (https://github.com/rtk-ai/rtk)
- context-mode (https://github.com/mksglu/context-mode)
- lean-ctx (https://github.com/yvgude/lean-ctx)
- tokf (https://github.com/mpecan/tokf)
- tamp (https://github.com/sliday/tamp)
- ecotokens (https://github.com/hansipie/ecotokens)
- token-enhancer (https://github.com/xelektron/token-enhancer)
许可证
Apache-2.0
AI 声明
本项目使用了多个 AI 工具。
相似文章
将 hf CLI 设计为适合 Hub 使用的 Agent 优化工具
Hugging Face 重新设计了其 `hf` CLI,使其同时面向人类用户和 Claude Code、Codex 等 AI 编程 Agent 进行优化,具备 Agent 感知的输出渲染能力,基准测试显示在复杂任务上相比不使用 CLI 的方案最高可节省 6 倍的 token 消耗。
@tom_doerr: 将 Claude Code 和 Cursor 的 token 成本降低 60-95% https://github.com/yvgude/lean-ctx
lean-ctx 是一个基于 Rust 的开源上下文运行时,通过文件读取压缩和 Shell 输出优化,将 Claude Code、Cursor、Copilot 等 AI 编程助手的 token 成本降低 60–95%。它以 Shell Hook 和 MCP Server 的形式运行,提供 56 个工具及多种读取模式。
@ClementDelangue:令牌成本决定了不会有SaaS末日——优秀的开发工具是代理的缓存智能!流行的观…
Hugging Face的hf CLI被证明远比手写原始API调用更高效、更成功,AI代理使用后基准测试显示令牌消耗减少多达6倍,任务成功率从84%提升至94%,这表明良好的抽象是代理的缓存智能。
我如何在长时间智能体运行中轻松减少约90%的输入token消耗
作者分享了一个实用技巧,通过提示缓存(prompt caching)在长时间智能体运行中将输入token成本降低约90%:将不变文本(系统提示、工具定义、上下文)放在每个提示的开头,以利用LLM提供商的缓存前缀。
git log 让你的智能体消耗了 624 个 token,但它只需要 55 个。以下是“罪魁祸首”名单
本文揭示了冗长的命令行界面(CLI)输出如何浪费 LLM 编程智能体的 token,并介绍了一种基于模式的压缩器,能够在保留关键信息的同时减少 shell 命令输出的噪声。