tournament-ranking

标签

Cards List
#tournament-ranking

HumorRank:基于锦标赛的排行榜,用于评估大语言模型的幽默生成能力

arXiv cs.CL · 2026-04-23 缓存

HumorRank 通过成对比较和 Bradley-Terry 最大似然估计,构建锦标赛式排行榜,对 LLM 的幽默生成进行排名,发现幽默质量取决于喜剧技巧而非模型规模。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈