标签
本文提出了一种针对长上下文对话系统中记忆访问与选择的统一框架,利用贝叶斯因子量化历史轮次对建模变化用户偏好的效用。实验表明,在偏好密集型任务中,该框架优于基于嵌入的检索方法。
本文介绍了一个面向约束幽默生成的系统,该系统采用“先生成大量候选,再择优选择”的策略,并使用从人类比较中学习到的偏好模型。在SemEval-2026任务1中,该系统在英语和中文子任务中排名第一,在西班牙语子任务中排名第二。