checkpoint-selection

标签

Cards List
#checkpoint-selection

基于智能体评估与稳定性感知排序的多模态大语言模型鲁棒检查点选择

arXiv cs.LG · 2026-05-20

本文解决了评估不确定性下多模态大语言模型的鲁棒检查点选择挑战,提出了一个多阶段框架,整合了精心策划的真实世界数据、基于LLM的判断以及带有置信度估计的排序协议。

0 人收藏 0 人点赞
#checkpoint-selection

LM预训练的泛化动态(阅读时间17分钟)

TLDR AI · 2026-05-19 缓存

本文揭示,在预训练过程中,语言模型会频繁且突然地在模式匹配与泛化行为之间切换,这种现象被称为“模式跳跃”(mode-hopping),并提出了一个用于研究该现象的小型评估套件。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈