encoder-pretraining

标签

Cards List
#encoder-pretraining

因果语言建模的短暂介入可提升编码器的继续预训练效果

Hugging Face Daily Papers · 2026-05-12 缓存

本文表明,在编码器适配过程中从掩码语言建模(MLM)切换至因果语言建模(CLM),能够提升在生物医学文本上的下游任务性能。作者发布了 ModernBERT-bio 和 ModernCamemBERT-bio,作为当前最先进的生物医学编码器。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈