path-pruning

#path-pruning

早期剪枝学习！高效并行推理的路径剪枝方法

arXiv cs.CL ↗ · 2026-04-20 缓存

本文提出了 STOP（SuperTOken for Pruning），一个系统框架，用于在大型推理模型的并行推理中早期剪枝低效推理路径。该方法在 1.5B 到 20B 参数的模型中实现了优异的效率和效果，在固定计算预算下将 GPT-OSS-20B 在 AIME25 上的准确率从 84% 提升到 90%。

0 人收藏 0 人点赞

path-pruning

早期剪枝学习！高效并行推理的路径剪枝方法

提交意见反馈