rubric-based-evaluation

标签

#rubric-based-evaluation

关于预测预训练大语言模型（LLM）的后训练潜力

arXiv cs.CL ↗ · 19小时前缓存

本文介绍了 RuDE，这是一种通过利用响应鉴别力来预测预训练大语言模型（LLM）后训练潜力的框架，旨在解决 MMLU 等传统基准测试的局限性。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈