@tonysimons_: 一位Netflix工程师构建了一个开源代理,可将AI token使用量减少60-95%。零代码更改。基准测试显示±0…
摘要
一位Netflix工程师构建了Headroom,这是一个开源代理,可在无需代码更改且精度损失可忽略的情况下,将LLM上下文压缩60-95%。它支持主要AI代理,并在GitHub上以Apache 2.0许可提供。
查看缓存全文
缓存时间: 2026/06/17 13:59
██╗ ██╗███████╗ █████╗ ██████╗ ██████╗ ██████╗ ██████╗ ███╗ ███╗ ██║ ██║██╔════╝██╔══██╗██╔══██╗██╔══██╗██╔═══██╗██╔═══██╗████╗ ████║ ███████║█████╗ ███████║██║ ██║██████╔╝██║ ██║██║ ██║██╔████╔██║ ██╔══██║██╔══╝ ██╔══██║██║ ██║██╔══██╗██║ ██║██║ ██║██║╚██╔╝██║ ██║ ██║███████╗██║ ██║██████╔╝██║ ██║╚██████╔╝╚██████╔╝██║ ╚═╝ ██║ ╚═╝ ╚═╝╚══════╝╚═╝ ╚═╝╚═════╝ ╚═╝ ╚═╝ ╚═════╝ ╚═════╝ ╚═╝ ╚═╝ AI 代理的上下文压缩层
减少 60–95% 的 token · 库 · 代理 · MCP · 6 种算法 · 本地优先 · 可逆
文档 · 安装 · 证明 · 代理 · Discord · llms.txt · 企业版
AI 代理 / LLM:在此处阅读 /llms.txt,或获取实时索引 / 完整文档 blob。
实时:10,144 → 1,260 token — 发现相同的 FATAL 错误。
相似文章
@hasantoxr: 所以我发现了一个GitHub仓库,它可以阻止AI代理无谓地消耗token。它叫Headroom。它是由一位……
Headroom是Netflix的Tejas Chopra开发的一个GitHub工具,它能在将输入(工具输出、日志、RAG块等)发送给LLM之前进行压缩,承诺在不改变答案的前提下减少60–95%的token。它支持Python/TypeScript库、本地代理、MCP服务器,以及针对流行编程代理的封装器。
@DataChaz: 最高减少95%的令牌消耗,无需修改代码 一位Netflix工程师刚刚开源了Headroom,这是……
Headroom是来自Netflix工程师的开源工具,它在本地代理中封装Cursor或Claude以压缩有效负载,无需修改代码即可将令牌使用量减少高达95%,同时保持逻辑准确性。
@AYi_AInotes: Damn,这个开源工具直接减少了95%token消耗 这可能是今年最狠的LLM降本神器, Netflix工程师开源的Headroom 把本地Agent套在Codex,Cursor,OpenClaw,Hermes或Claude code外面…
Netflix工程师开源了Headroom工具,在本地预处理阶段自动压缩LLM输入上下文,减少高达95%的token消耗,兼容Codex、Cursor等主流AI编码工具,无需修改代码即可生效。
@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2062553418460479577
一款名为Headroom的开源工具采用可逆的Compress-Cache-Retrieve架构,能将AI智能体上下文压缩高达90%,使模型能够在需要时检索原始细节,而非永久丢弃。
Headroom (GitHub 仓库)
Headroom 是一个开源工具,能在 AI 代理读取上下文(工具输出、日志、RAG 块、对话历史等)之前对其进行压缩,在到达 LLM 时可减少 60–95% 的令牌数量,同时保留答案质量。它支持多种集成模式,包括库、代理、代理包装和 MCP 服务器,并提供可逆压缩与跨代理记忆。