low-rank-parameterization

标签

Cards List
#low-rank-parameterization

SlimSpec: 用于加速推测解码的低秩 Draft LM-Head

Hugging Face Daily Papers · 2026-05-11 缓存

SlimSpec 为 drafter LM-head 引入了低秩参数化方法,以加速 LLMs 中的推测解码,在保持完整词表支持的同时实现了 4-5 倍加速。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈