generalization-dynamics

标签

Cards List
#generalization-dynamics

LM预训练的泛化动态(阅读时间17分钟)

TLDR AI · 2026-05-19 缓存

本文揭示,在预训练过程中,语言模型会频繁且突然地在模式匹配与泛化行为之间切换,这种现象被称为“模式跳跃”(mode-hopping),并提出了一个用于研究该现象的小型评估套件。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈