decoder-only

标签

Cards List
#decoder-only

River-LLM:基于 KV 共享的大模型无感早退方案

Hugging Face Daily Papers · 2026-04-20 缓存

River-LLM 提出一种无需训练的 decoder-only 大模型早退框架,通过 KV 共享消除 KV-cache 缺口,在无损质量的前提下实现 1.71–2.16 倍推理加速。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈