transformer-optimization

标签

Cards List
#transformer-optimization

超越 FP16 + ONNX 的 Transformer 体积与推理优化(剪枝/图优化收效甚微)[P]

Reddit r/MachineLearning · 2026-04-23

作者分享在 162 MB Transformer 上把 FP16 + ONNX + 剪枝用到极致却收益递减的经历,求教下一步该选量化、蒸馏、低秩分解还是硬件级技巧。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈