multimodal-evaluation

标签

Cards List
#multimodal-evaluation

MM-JudgeBias:评测 MLLM-as-a-Judge 组合偏差的基准

Hugging Face Daily Papers · 2026-04-20 缓存

研究者发布 MM-JudgeBias 基准,揭示多模态大模型在充当自动评判器时的系统性组合偏差,对 26 个 SOTA MLLM 在 1,800 条样本上进行测试。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈