token-regularization

标签

Cards List
#token-regularization

泛化的搭便车假说:解释与缓解涌现性失调

arXiv cs.CL · 2026-06-08 缓存

提出搭便车假说,认为对话模板标记(chat-template tokens)可能导致大型语言模型(LLMs)中的涌现性失调,并引入了令牌正则化微调(TReFT)来缓解这一问题,同时保持域内学习。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈