multimodal-evaluation

#multimodal-evaluation

MM-JudgeBias：评测 MLLM-as-a-Judge 组合偏差的基准

Hugging Face Daily Papers ↗ · 2026-04-20 缓存

研究者发布 MM-JudgeBias 基准，揭示多模态大模型在充当自动评判器时的系统性组合偏差，对 26 个 SOTA MLLM 在 1,800 条样本上进行测试。

0 人收藏 0 人点赞