transformers-v5

#transformers-v5

使用 NVIDIA NeMo AutoModel 加速 Transformer 微调

Hugging Face Blog ↗ · 14小时前缓存

NVIDIA NeMo AutoModel 利用 HuggingFace Transformers v5，在微调 Mixture-of-Experts 模型时，无需修改代码（只需一个导入），即可实现 3.4 至 3.7 倍的训练吞吐量提升和 29% 至 32% 的 GPU 内存减少。

0 人收藏 0 人点赞