rubric-based-evaluation

标签

Cards List
#rubric-based-evaluation

关于预测预训练大语言模型(LLM)的后训练潜力

arXiv cs.CL · 19小时前 缓存

本文介绍了 RuDE,这是一种通过利用响应鉴别力来预测预训练大语言模型(LLM)后训练潜力的框架,旨在解决 MMLU 等传统基准测试的局限性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈