prefill-only-finetuning

标签

Cards List
#prefill-only-finetuning

PreFT:仅预填充微调以实现高效推理

arXiv cs.LG · 2026-05-15 缓存

PreFT 提出仅在预填充 token 上应用适配器,在解码阶段丢弃它们,从而在几乎不损失性能的情况下提高多适配器服务的吞吐量。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈