together-ai

标签

Cards List
#together-ai

新的 KV 量化方案来了 😍 Welcome OSCAR kv quant 由 Together AI 开源

Reddit r/LocalLLaMA · 2026-05-26 缓存

Together AI 开源了 OSCAR,一种注意力感知的 2 位 KV 缓存量化系统,通过根据注意力重要性重新分配量化误差,实现了高效的长上下文 LLM 服务。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈