2d-strategy

标签

Cards List
#2d-strategy

大模型推理的二维早退优化

arXiv cs.CL · 2026-04-22 缓存

作者提出一种二维早退方法,同时裁剪层与输入句子,在 Llama 3.1/3.2、Gemma 与 Qwen 模型的情感任务上额外获得 1.4–2.3 倍加速。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈