标签
本文提出了一种针对电商推荐的碳感知重排序策略,利用检索增强流水线估计产品碳足迹,并在预测的参与度与可持续性之间进行权衡。基于Amazon评论数据集的评估表明,在参与度损失极小的情况下可实现显著的碳减排。
τ-Rec是一个用于智能推荐系统的可验证基准,它用可验证奖励和控制对话约束取代了主观的LLM-as-a-judge评估,揭示了主流模型存在陡峭的可靠性悬崖——即便是表现最佳的模型,其pass@1也仅有约57%。
本文提出RankElastor,一种新颖的架构,通过引入参数化全混合和GLU改进的P-FFN,缓解推荐模型密集扩展中的嵌入坍塌,实现鲁棒扩展并在大规模数据集上提升性能。
PEARL引入了一种对比分位数近似框架,用以缓解推荐系统中的行为强度不平衡问题,在服务数十亿用户的生产级直播平台上实现了参与度指标的显著提升。