标签
本文提出了一种帕累托引导的教师对齐方法,用于公平的个性化文本生成,旨在平衡语言模型输出中的多个目标。
本文提出PAFO,一种帕累托公平优化框架,用于缓解大语言模型奖励模型中的个性化奖励偏差,在不损害多数用户组的情况下提高少数用户组的准确性。