@tonysimons_: 一位Netflix工程师构建了一个开源代理,可将AI token使用量减少60-95%。零代码更改。基准测试显示±0…

X AI KOLs Timeline 工具

摘要

一位Netflix工程师构建了Headroom,这是一个开源代理,可在无需代码更改且精度损失可忽略的情况下,将LLM上下文压缩60-95%。它支持主要AI代理,并在GitHub上以Apache 2.0许可提供。

一位Netflix工程师构建了一个开源代理,可将AI token使用量减少60-95%。 无需更改代码。 基准测试显示精度回归为±0.000。 在GitHub上获得29.9k星标。 它位于你的应用和LLM之间,因此每个工具输出、代码块和对话历史都在传输过程中被压缩。 无需摘要,无损失。 只需60-95%更少的token,答案相同。 适用于Claude Code、Cursor、Copilot以及任何兼容OpenAI的客户端。 一次pip安装,一个环境变量,完成。 Netflix内部使用。 Apache 2.0。 由Tejas Chopra构建。 http://github.com/chopratejas/headroom…
查看原文
查看缓存全文

缓存时间: 2026/06/17 13:59

██╗ ██╗███████╗ █████╗ ██████╗ ██████╗ ██████╗ ██████╗ ███╗ ███╗ ██║ ██║██╔════╝██╔══██╗██╔══██╗██╔══██╗██╔═══██╗██╔═══██╗████╗ ████║ ███████║█████╗ ███████║██║ ██║██████╔╝██║ ██║██║ ██║██╔████╔██║ ██╔══██║██╔══╝ ██╔══██║██║ ██║██╔══██╗██║ ██║██║ ██║██║╚██╔╝██║ ██║ ██║███████╗██║ ██║██████╔╝██║ ██║╚██████╔╝╚██████╔╝██║ ╚═╝ ██║ ╚═╝ ╚═╝╚══════╝╚═╝ ╚═╝╚═════╝ ╚═╝ ╚═╝ ╚═════╝ ╚═════╝ ╚═╝ ╚═╝ AI 代理的上下文压缩层

减少 60–95% 的 token · 库 · 代理 · MCP · 6 种算法 · 本地优先 · 可逆

文档 · 安装 · 证明 · 代理 · Discord · llms.txt · 企业版

AI 代理 / LLM:在此处阅读 /llms.txt,或获取实时索引 / 完整文档 blob。

实时:10,144 → 1,260 token — 发现相同的 FATAL 错误。

相似文章

Headroom (GitHub 仓库)

TLDR AI

Headroom 是一个开源工具,能在 AI 代理读取上下文(工具输出、日志、RAG 块、对话历史等)之前对其进行压缩,在到达 LLM 时可减少 60–95% 的令牌数量,同时保留答案质量。它支持多种集成模式,包括库、代理、代理包装和 MCP 服务器,并提供可逆压缩与跨代理记忆。