reft

标签

Cards List
#reft

PreFT:仅预填充微调以实现高效推理

arXiv cs.LG · 20小时前 缓存

PreFT 提出仅在预填充 token 上应用适配器,在解码阶段丢弃它们,从而在几乎不损失性能的情况下提高多适配器服务的吞吐量。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈