标签
社区发布:用 REAP 把 NVIDIA Nemotron-3-Super-120B 剪到 64B,再用 GRPO 做数学强化微调,最后 AWQ/FP8 量化,单卡 H100/RTX PRO 6000 即可跑到 AIME 2026 90%+。