micro-pretraining

标签

Cards List
#micro-pretraining

小型实验,更便宜的决策:微预训练中分阶段提升的案例研究

arXiv cs.CL · 5天前 缓存

本文研究了一种用于微预训练的分阶段提升协议,使用从分钟到小时递增的预算来筛选配置。研究发现,早期筛选是有用的但不稳定,并且分阶段方法可以保留长期参考,同时识别出未能通过继续阈值的替代方案。

0 人收藏 0 人点赞
#micro-pretraining

预算受限微预训练的分阶段因子筛选

arXiv cs.LG · 2026-06-05 缓存

本文提出了一种适用于预算受限微预训练的分阶段因子筛选工作流,表明短期的设计实验能够识别稳定的超参数惩罚方向,并支持“筛选-优化”策略。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈