@tonysimons_: 一位Netflix工程师构建了一个开源代理，可将AI token使用量减少60-95%。零代码更改。基准测试显示±0…

X AI KOLs Timeline 2026/06/17 03:11 工具

open-source proxy token-compression ai-agents llm netflix github

摘要

一位Netflix工程师构建了Headroom，这是一个开源代理，可在无需代码更改且精度损失可忽略的情况下，将LLM上下文压缩60-95%。它支持主要AI代理，并在GitHub上以Apache 2.0许可提供。

一位Netflix工程师构建了一个开源代理，可将AI token使用量减少60-95%。无需更改代码。基准测试显示精度回归为±0.000。在GitHub上获得29.9k星标。它位于你的应用和LLM之间，因此每个工具输出、代码块和对话历史都在传输过程中被压缩。无需摘要，无损失。只需60-95%更少的token，答案相同。适用于Claude Code、Cursor、Copilot以及任何兼容OpenAI的客户端。一次pip安装，一个环境变量，完成。 Netflix内部使用。 Apache 2.0。由Tejas Chopra构建。 http://github.com/chopratejas/headroom…

查看原文

查看缓存全文

缓存时间: 2026/06/17 13:59

██╗ ██╗███████╗ █████╗ ██████╗ ██████╗ ██████╗ ██████╗ ███╗ ███╗ ██║ ██║██╔════╝██╔══██╗██╔══██╗██╔══██╗██╔═══██╗██╔═══██╗████╗ ████║ ███████║█████╗ ███████║██║ ██║██████╔╝██║ ██║██║ ██║██╔████╔██║ ██╔══██║██╔══╝ ██╔══██║██║ ██║██╔══██╗██║ ██║██║ ██║██║╚██╔╝██║ ██║ ██║███████╗██║ ██║██████╔╝██║ ██║╚██████╔╝╚██████╔╝██║ ╚═╝ ██║ ╚═╝ ╚═╝╚══════╝╚═╝ ╚═╝╚═════╝ ╚═╝ ╚═╝ ╚═════╝ ╚═════╝ ╚═╝ ╚═╝ AI 代理的上下文压缩层

减少 60–95% 的 token · 库 · 代理 · MCP · 6 种算法 · 本地优先 · 可逆

文档 · 安装 · 证明 · 代理 · Discord · llms.txt · 企业版

AI 代理 / LLM：在此处阅读 /llms.txt，或获取实时索引 / 完整文档 blob。

实时：10,144 → 1,260 token — 发现相同的 FATAL 错误。

相似文章

@hasantoxr: 所以我发现了一个GitHub仓库，它可以阻止AI代理无谓地消耗token。它叫Headroom。它是由一位……

X AI KOLs Timeline

Headroom是Netflix的Tejas Chopra开发的一个GitHub工具，它能在将输入（工具输出、日志、RAG块等）发送给LLM之前进行压缩，承诺在不改变答案的前提下减少60–95%的token。它支持Python/TypeScript库、本地代理、MCP服务器，以及针对流行编程代理的封装器。

@DataChaz: 最高减少95%的令牌消耗，无需修改代码一位Netflix工程师刚刚开源了Headroom，这是……

X AI KOLs Timeline

Headroom是来自Netflix工程师的开源工具，它在本地代理中封装Cursor或Claude以压缩有效负载，无需修改代码即可将令牌使用量减少高达95%，同时保持逻辑准确性。

@AYi_AInotes: Damn，这个开源工具直接减少了95%token消耗这可能是今年最狠的LLM降本神器， Netflix工程师开源的Headroom 把本地Agent套在Codex，Cursor，OpenClaw，Hermes或Claude code外面…

X AI KOLs Timeline

Netflix工程师开源了Headroom工具，在本地预处理阶段自动压缩LLM输入上下文，减少高达95%的token消耗，兼容Codex、Cursor等主流AI编码工具，无需修改代码即可生效。

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2062553418460479577

X AI KOLs Timeline

一款名为Headroom的开源工具采用可逆的Compress-Cache-Retrieve架构，能将AI智能体上下文压缩高达90%，使模型能够在需要时检索原始细节，而非永久丢弃。

Headroom (GitHub 仓库)

TLDR AI

Headroom 是一个开源工具，能在 AI 代理读取上下文（工具输出、日志、RAG 块、对话历史等）之前对其进行压缩，在到达 LLM 时可减少 60–95% 的令牌数量，同时保留答案质量。它支持多种集成模式，包括库、代理、代理包装和 MCP 服务器，并提供可逆压缩与跨代理记忆。

相似文章

@hasantoxr: 所以我发现了一个GitHub仓库，它可以阻止AI代理无谓地消耗token。它叫Headroom。它是由一位……

@DataChaz: 最高减少95%的令牌消耗，无需修改代码 一位Netflix工程师刚刚开源了Headroom，这是……

@AYi_AInotes: Damn，这个开源工具直接减少了95%token消耗 这可能是今年最狠的LLM降本神器， Netflix工程师开源的Headroom 把本地Agent套在Codex，Cursor，OpenClaw，Hermes或Claude code外面…

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2062553418460479577

Headroom (GitHub 仓库)

提交意见反馈

@DataChaz: 最高减少95%的令牌消耗，无需修改代码一位Netflix工程师刚刚开源了Headroom，这是……

@AYi_AInotes: Damn，这个开源工具直接减少了95%token消耗这可能是今年最狠的LLM降本神器， Netflix工程师开源的Headroom 把本地Agent套在Codex，Cursor，OpenClaw，Hermes或Claude code外面…