rubric-anchoring

#rubric-anchoring

AI评分员在复杂临床决策中的区分能力取决于评分协议

arXiv cs.CL ↗ · 昨天缓存

本研究考察了AI评分员（LLMs）在复杂2型糖尿病药物治疗中根据不同协议对临床AI输出进行评分的方式，发现基于评分标准的评分比无标准评分具有更强的区分能力。

0 人收藏 0 人点赞

#rubric-anchoring

Hugging Face Daily Papers ↗ · 6天前缓存

MIRA是一个用于大语言模型开发中间训练阶段的数据选择框架，它自适应地按数据源构建质量评分标准，使用教师模型提出维度并蒸馏为轻量级评分器。与全语料训练相比，仅使用一半的token即可实现更优性能。

0 人收藏 0 人点赞