transformers-v5

标签

Cards List
#transformers-v5

使用 NVIDIA NeMo AutoModel 加速 Transformer 微调

Hugging Face Blog · 14小时前 缓存

NVIDIA NeMo AutoModel 利用 HuggingFace Transformers v5,在微调 Mixture-of-Experts 模型时,无需修改代码(只需一个导入),即可实现 3.4 至 3.7 倍的训练吞吐量提升和 29% 至 32% 的 GPU 内存减少。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈