mmlu

标签

Cards List
#mmlu

面向专业人类与大语言模型协作的能力条件化支架

arXiv cs.CL · 18小时前 缓存

介绍了能力条件化支架,一种用于大语言模型协作的框架,根据用户专业领域调整干预措施以防止专业领域漂移,并在MMLU子集上进行了试点评估。

0 人收藏 0 人点赞
#mmlu

前沿大语言模型中的领域级元认知监控:一份33个模型图谱

arXiv cs.CL · 2026-05-11 缓存

本研究提出了一份涵盖33个模型的图谱,利用MMLU基准分析了前沿大语言模型中的领域级元认知监控,揭示了聚合指标所掩盖的不同知识领域中置信度校准的显著差异。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈