central-tendency

#central-tendency

审计多模态LLM评分器：临床序数评分中的中央趋势偏差

Hugging Face Daily Papers ↗ · 2026-05-11 缓存

本文研究了用于临床序数评分（画钟测试）的多模态LLM中的中央趋势偏差。研究发现，LLM将预测结果向量表中间压缩，对关键极端值造成不成比例的影响。该研究将LLM作为裁判的偏差文献扩展到临床评估领域，强调在部署前需要进行校准感知评估。

0 人收藏 0 人点赞