path-pruning

标签

Cards List
#path-pruning

早期剪枝学习!高效并行推理的路径剪枝方法

arXiv cs.CL · 2026-04-20 缓存

本文提出了 STOP(SuperTOken for Pruning),一个系统框架,用于在大型推理模型的并行推理中早期剪枝低效推理路径。该方法在 1.5B 到 20B 参数的模型中实现了优异的效率和效果,在固定计算预算下将 GPT-OSS-20B 在 AIME25 上的准确率从 84% 提升到 90%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈