training-configurations

标签

Cards List
#training-configurations

小型实验,更便宜的决策:微预训练中分阶段提升的案例研究

arXiv cs.CL · 5天前 缓存

本文研究了一种用于微预训练的分阶段提升协议,使用从分钟到小时递增的预算来筛选配置。研究发现,早期筛选是有用的但不稳定,并且分阶段方法可以保留长期参考,同时识别出未能通过继续阈值的替代方案。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈