micro-pretraining

#micro-pretraining

小型实验，更便宜的决策：微预训练中分阶段提升的案例研究

arXiv cs.CL ↗ · 5天前缓存

本文研究了一种用于微预训练的分阶段提升协议，使用从分钟到小时递增的预算来筛选配置。研究发现，早期筛选是有用的但不稳定，并且分阶段方法可以保留长期参考，同时识别出未能通过继续阈值的替代方案。

0 人收藏 0 人点赞

#micro-pretraining

arXiv cs.LG ↗ · 2026-06-05 缓存

本文提出了一种适用于预算受限微预训练的分阶段因子筛选工作流，表明短期的设计实验能够识别稳定的超参数惩罚方向，并支持“筛选-优化”策略。

0 人收藏 0 人点赞