central-tendency

标签

Cards List
#central-tendency

审计多模态LLM评分器:临床序数评分中的中央趋势偏差

Hugging Face Daily Papers · 2026-05-11 缓存

本文研究了用于临床序数评分(画钟测试)的多模态LLM中的中央趋势偏差。研究发现,LLM将预测结果向量表中间压缩,对关键极端值造成不成比例的影响。该研究将LLM作为裁判的偏差文献扩展到临床评估领域,强调在部署前需要进行校准感知评估。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈