soft-labels

标签

Cards List
#soft-labels

多数票压制少数价值观:HateXplain中仇恨/冒犯边界的标注者分歧

arXiv cs.CL · 5天前 缓存

本文发现,HateXplain中42.6%的标注者分歧集中在仇恨/冒犯边界,表明多数票压制了少数价值观,导致模型对有争议的输入输出错误但高度自信的预测。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈