标签
本文介绍了一个面向约束幽默生成的系统,该系统采用“先生成大量候选,再择优选择”的策略,并使用从人类比较中学习到的偏好模型。在SemEval-2026任务1中,该系统在英语和中文子任务中排名第一,在西班牙语子任务中排名第二。
HumorRank 通过成对比较和 Bradley-Terry 最大似然估计,构建锦标赛式排行榜,对 LLM 的幽默生成进行排名,发现幽默质量取决于喜剧技巧而非模型规模。