megatrain

标签

Cards List
#megatrain

@che_shr_cat: 1/ 我们一直误解了GPU内存的使用方式。如果GPU根本不需要存储你的模型呢?MegaTrain 实现了…

X AI KOLs Timeline · 18小时前 缓存

MegaTrain 通过将 VRAM 视为瞬时无状态缓存,反转内存层次结构,在单张 GPU 上实现了 100B 以上大语言模型的全精度训练。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈