用可持续性换取参与度:电商推荐中的碳感知重排序

arXiv cs.AI 论文

摘要

本文提出了一种针对电商推荐的碳感知重排序策略,利用检索增强流水线估计产品碳足迹,并在预测的参与度与可持续性之间进行权衡。基于Amazon评论数据集的评估表明,在参与度损失极小的情况下可实现显著的碳减排。

arXiv:2606.04550v1 公告类型:跨领域 摘要:电商推荐系统强烈影响用户考虑和购买的产品,然而诸如产品碳足迹(PCF)等可持续性信号在目录规模下几乎不可用。我们研究了在大多数商品缺少PCF标签且必须推断的现实场景下的碳感知产品推荐。首先,通过一个检索增强的PCF估计流水线估算产品层面的碳足迹,该流水线利用语义相似性搜索、少样本大语言模型提示和最近邻回退,将监督信号从Carbon Catalogue(一组经过生命周期评估的产品)迁移到大规模无标注的电商目录。然后,我们基于三种已建立的推荐模型(BPR、NeuMF和LightGCN)产生的相关性分数,应用一种碳感知的事后重排序策略。该方法通过一个可调参数λ在预测的用户-商品参与度和估计碳足迹之间进行权衡。在这项离线研究中,参与度通过Amazon评论交互来操作化,这些交互作为隐式反馈和用户兴趣或购买行为的代理。我们在Amazon Reviews数据集上跨三个产品类别(家居与厨房、运动与户外、电子产品)评估该框架。通过扫描λ,我们构建了帕累托前沿,刻画了每个模型和类别中可实现的参与度与碳的权衡。所有模型和类别在参与度损失极小的情况下都能实现显著的碳减排。然而,可用的碳减排空间因模型和类别而异,这凸显了模型选择和领域背景的重要性。
查看原文
查看缓存全文

缓存时间: 2026/06/08 09:15

# 用参与度换取可持续性:面向电子商务推荐的碳感知重排序
来源:https://arxiv.org/html/2606.04550
Jørgen Bergh¹¹footnotemark:1 加州大学伯克利分校 Noah Lund Syrdal¹¹footnotemark:1 加州大学伯克利分校

###### 摘要

电子商务推荐系统深刻影响着用户考虑和购买的产品,然而,像产品碳足迹(Product Carbon Footprint, PCF)这样的可持续性信号在目录规模上几乎不可用。我们在一个现实场景中研究碳感知产品推荐,即大多数商品的PCF标签缺失,必须进行推断。我们首先通过一个检索增强的PCF估计流程来估算产品级碳足迹,该流程利用语义相似性搜索、少样本大语言模型提示和最近邻回退策略,将监督信息从碳目录(Carbon Catalogue,一组经过生命周期评估的产品小集合)迁移到大规模未标记的电子商务目录。然后,我们在三个成熟的推荐模型(BPR、NeuMF、LightGCN)生成的关联性分数之上,应用一种碳感知的事后重排序策略,通过一个可调参数λ来权衡预测的用户-商品参与度与估算的碳足迹。在本离线研究中,参与度通过亚马逊评论交互操作化,这些评论既作为隐式反馈,也作为用户兴趣或购买行为的代理。我们在亚马逊评论数据集上对三个产品类别(家居厨房、运动户外、电子产品)评估了该框架。通过扫瞄λ,我们为每个模型和类别构建了描述可实现参与度与碳权衡的帕累托前沿。在所有模型和类别中,都可在极小的参与度代价下实现显著的碳减排。然而,可用的碳改善空间因模型和类别而异,这突显了模型选择和领域背景的重要性。¹¹代码见:https://github.com/andersvestrum/carbon-aware-recsys

## 1 引言

在线零售已成为消费者获取商品的主要渠道之一,其增长带来的环境后果在包括物流运输、包装废弃物和退货驱动的逆向供应链等多个维度上受到了持续关注[19 (https://arxiv.org/html/2606.04550#bib.bib3)]。问题的规模相当可观:联合国贸易和发展会议估计,2022年全球电子商务销售额达到27万亿美元[23 (https://arxiv.org/html/2606.04550#bib.bib14)],且这一体量带来的碳排放后果被日益证明是温室气体排放的重要贡献者[4 (https://arxiv.org/html/2606.04550#bib.bib15)]。在线零售的环境足迹并非均匀分布。它在很大程度上取决于如何构建购买决策并将其呈现给消费者[4 (https://arxiv.org/html/2606.04550#bib.bib15)]。

在政策层面,这种紧迫性已通过立法得到体现。欧盟关于赋能消费者实现绿色转型的第2024/825号指令,加强了围绕环境声明和面向消费者的可持续性信息的规则[8 (https://arxiv.org/html/2606.04550#bib.bib16)]。更广泛地说,《欧洲绿色协议》的政策文件与SDG 12(可持续消费和生产)高度一致[16 (https://arxiv.org/html/2606.04550#bib.bib17)],将需求侧干预视为脱碳的结构性组成部分,而非事后的监管考量。推荐系统恰好处于算法设计与消费政治的这一交汇点:它们是在大型在线市场中消费者接触产品的主要界面。

在大型在线市场中,推荐系统在决定哪些产品对用户可见方面发挥着核心作用,因此可以间接塑造消费模式[14 (https://arxiv.org/html/2606.04550#bib.bib5),12 (https://arxiv.org/html/2606.04550#bib.bib4)]。通过控制用户最可能遇到哪些产品,推荐算法有可能在不限制用户选择的情况下,将需求转向影响较低的产品。

因此,最近的研究已开始探索“可持续性感知的推荐系统”,其中碳足迹等环境信号被纳入推荐决策[15 (https://arxiv.org/html/2606.04550#bib.bib6),21 (https://arxiv.org/html/2606.04550#bib.bib1),22 (https://arxiv.org/html/2606.04550#bib.bib7),24 (https://arxiv.org/html/2606.04550#bib.bib2)]。一个重要的可持续性信号是“产品碳足迹(PCF)”,通常以千克二氧化碳当量来衡量,并使用生命周期评估(LCA)方法进行估算[18 (https://arxiv.org/html/2606.04550#bib.bib8)]。大规模获取PCF值确实困难:LCA研究需要广泛的供应链数据,并且对于大型电子商务目录中的长尾产品很少可用[18 (https://arxiv.org/html/2606.04550#bib.bib8)]。因此,大多数推荐系统数据集缺乏商品级别的环境影响信息。

为了解决这一限制,近期工作提出了使用大语言模型(LLM)或其他预测方法从产品元数据中估算PCF,从而能够在标准推荐数据集上进行可持续性感知的实验[24 (https://arxiv.org/html/2606.04550#bib.bib2),22 (https://arxiv.org/html/2606.04550#bib.bib7)]。这些研究表明,环境信号可以被纳入推荐流程,通常通过结合预测的商品关联性与估算的环境影响的事后重排序策略来实现。

我们在一个现实电子商务环境中研究碳感知推荐,其中大多数商品的PCF标签缺失。我们的方法遵循一个模块化流程,旨在支持强基线和可重复评估。我们首先使用RecBole框架[26 (https://arxiv.org/html/2606.04550#bib.bib11)]中实现的成熟协同过滤和神经推荐模型生成候选推荐。这些模型产生关联性分数,经过每用户最小-最大归一化后,作为我们重排序步骤中的参与度信号。然后,我们应用一种碳感知的重排序策略,通过一个可调参数权衡模型预测的关联性与估算的产品碳足迹。

我们使用亚马逊评论数据集作为用户和商品交互的大规模代理来评估此框架[13 (https://arxiv.org/html/2606.04550#bib.bib10)],重点关注三个代表性产品类别:家居厨房、运动户外和电子产品。评论作为用户参与度或购买行为的隐式信号,由于其规模大且产品元数据丰富,被广泛用于推荐系统研究[17 (https://arxiv.org/html/2606.04550#bib.bib9),13 (https://arxiv.org/html/2606.04550#bib.bib10),24 (https://arxiv.org/html/2606.04550#bib.bib2),22 (https://arxiv.org/html/2606.04550#bib.bib7)]。虽然此类观测数据引入了众所周知的偏差(包括自选择偏差和曝光偏差),但它能够在目录规模上对推荐策略进行受控的离线分析。

我们的目标是分析模型预测的关联性与推荐产品碳足迹之间的权衡。通过改变λ,我们构建了一个参与度与碳的帕累托前沿,表征可持续性目标如何与不同产品类别和模型家族的推荐性能相互作用。

#### 研究问题。

我们围绕三个问题组织本研究:

- • RQ1:碳感知重排序如何影响不同候选生成模型的推荐质量?
- • RQ2:在保持可接受的参与度表现的同时,可以实现推荐商品碳足迹多大的降低?
- • RQ3:不同的推荐算法是否表现出不同的参与度与可持续性权衡?

#### 贡献。

先前关于可持续性感知推荐的工作要么假设商品级PCF标签已可用[21 (https://arxiv.org/html/2606.04550#bib.bib1),15 (https://arxiv.org/html/2606.04550#bib.bib6)],要么在小规模、特定领域的数据集上运行[24 (https://arxiv.org/html/2606.04550#bib.bib2),22 (https://arxiv.org/html/2606.04550#bib.bib7)]。我们解决了现实中大规模场景下几乎所有目录商品标签都缺失的问题。具体贡献包括:

- • 一个“检索增强的PCF估计流程”,将监督信息从866种经过生命周期评估的产品迁移到未标记的电子商务目录,无需产品特定的供应链数据,结合了少样本LLM估计,并将此设计与独立的最近邻和零样本LLM基线进行了比较。
- • 一个“多模型帕累托分析”,涵盖三个互补的推荐范式(成对协同过滤、神经矩阵分解和图卷积),基于大规模公共数据集,在需要推断商品级PCF的环境中,提供了参与度与碳权衡的统一比较。
- • 一个“模块化、可审计的重排序设计”,其中可持续性权重λ是一个显式、可检查的参数,而非隐式模型选择,符合新兴的算法透明度要求[7 (https://arxiv.org/html/2606.04550#bib.bib22)]。

## 2 相关工作

### 2.1 可持续性感知推荐系统

近期研究已开始将环境目标纳入推荐系统。早期工作表明,将碳足迹信息纳入推荐排序可以揭示推荐准确性与环境影响之间的权衡[21 (https://arxiv.org/html/2606.04550#bib.bib1),22 (https://arxiv.org/html/2606.04550#bib.bib7),24 (https://arxiv.org/html/2606.04550#bib.bib2)]。类似地,可持续性感知推荐框架已显示出,事后重排序策略可以在保持推荐质量的同时降低推荐商品的平均足迹,明确表征了准确性与环境影响之间的权衡[15 (https://arxiv.org/html/2606.04550#bib.bib6)]。这些研究确立了将环境信号纳入推荐流程的可行性,但通常是在具有已知足迹标签的特定领域数据集上操作。该领域更广泛的综述进一步识别出在评估指标中缺少考虑可持续性结果(如减少碳足迹)的系统性差距,并将推荐系统定位为通过行为影响实现联合国可持续发展目标的工具[10 (https://arxiv.org/html/2606.04550#bib.bib18)]。Kalisvaart等人[15 (https://arxiv.org/html/2606.04550#bib.bib6)]进一步引入了一个考虑位置的绿色度指标,在将商品级排放映射到有界绿色度标度之后。在我们的场景中,目录规模的亚马逊PCF值是推断而非观测得到的,因此我们报告AvgPCF@10(以千克二氧化碳当量为单位)以及相对碳减排量。

### 2.2 估算产品碳足迹

可持续性感知推荐的一个核心挑战是商品级碳足迹数据的稀缺。碳目录(Carbon Catalogue)提供了少数几个公开可用的数据集之一,包含从生命周期评估中得出的产品级PCF估计值[18 (https://arxiv.org/html/2606.04550#bib.bib8)]。更近期的工作试图使用机器学习方法,包括基于LLM的方法,从产品描述和元数据中推断PCF值[24 (https://arxiv.org/html/2606.04550#bib.bib2),22 (https://arxiv.org/html/2606.04550#bib.bib7)]。

上下文学习的并行进展表明,当提供具有代表性的标记示例时,大语言模型可以在最少任务特定监督的情况下执行结构化预测任务[6 (https://arxiv.org/html/2606.04550#bib.bib24),3 (https://arxiv.org/html/2606.04550#bib.bib25)]。检索增强生成通过将模型输出置于检索到的证据(而非仅参数化知识)基础上,进一步扩展了这一能力,显著提高了在特定领域数值任务上的可靠性[11 (https://arxiv.org/html/2606.04550#bib.bib26)]。要求模型在给出最终答案之前逐步推理,进一步提高了数值估计质量[25 (https://arxiv.org/html/2606.04550#bib.bib28)]。

我们基于这些进展,采用一种检索增强的估计流程,将语义相似性搜索与结构化LLM提示相结合,从可用元数据中推断亚马逊产品的PCF值[17 (https://arxiv.org/html/2606.04550#bib.bib9),13 (https://arxiv.org/html/2606.04550#bib.bib10)],从而能够进行大规模碳感知推荐的实验。我们对检索增强提示的使用遵循与近期基于LLM的PCF估计工作相同的一般技术家族,但在嵌入到更大的推荐研究中的方式有所不同:我们在留出的碳目录产品上比较PCF估计器,基于该基准选择下游使用的估计器,然后评估推断的PCF值如何影响多模型推荐权衡,而不是将PCF估计作为终点。

### 2.3 推荐基础设施与基线模型

现代推荐系统研究依赖于标准化框架和强基线模型。RecBole提供了一个统一的库,实现了数十种推荐算法并具有一致的评估协议,促进了跨模型家族的可重复实验[26 (https://arxiv.org/html/2606.04550#bib.bib11)]。这些模型产生的关联性分数直接作为事后重排序流程中预测用户参与度的代理,使得在不修改底层推荐模型的情况下,很容易纳入碳足迹等额外目标。

### 2.4 推荐的行为效应与数字助推

推荐排序通过塑造用户考虑的备选方案集来影响用户决策。数字助推研究已系统性地记录了这种效应,证明推荐系统通过框架效应、显著性和排序位置等机制改变用户行为[14 (https://arxiv.org/html/2606.04550#bib.bib5)]。因此,排序标准的设计并非中性的技术决策;它构成了一种选择,决定哪些产品获得关注,进而决定哪些消费模式得到强化。在可持续性背景下,解释和信息框架已被证明能显著增加用户选择环保产品的可能性[12 (https://arxiv.org/html/2606.04550#bib.bib4)]。然而,推荐驱动的行为改变并非总是有益的:模拟研究表明,当系统在已受先前推荐影响的数据上训练时,会出现一种反馈循环,使行为同质化且不改善效用[5 (https://arxiv.org/html/2606.04550#bib.bib21)]。这一发现强调了推荐系统放大内容的“实质”很重要,并为引入碳感知目标作为纠正纯参与度优化的措施提供了额外动机。涵盖2008至2024年间助推干预的综述证实,数字助推已成为一个不断发展的子领域,其中基于排序和基于显著性的干预是促进可持续选择方面研究最多的工具之一[1 (https://arxiv.org/html/2606.04550#bib.bib19)]。

相似文章

Representation Curriculum: 分阶段训练以实现稳健排序与分配

arXiv cs.LG

本文提出Representation Curriculum (RC),一种训练时干预方法,通过分阶段利用特征来减少对曝光混杂历史信号的过度依赖,并改善排序系统中的冷启动泛化能力。该方法经过了理论分析,并在公开基准和大规模eBay搜索实验中得到了验证。

通过后分层降低排序实验中重尾变现指标的方差

arXiv cs.LG

研究人员提出了一种实用的方差缩减框架,将后分层与 CUPED 相结合,用于处理排序实验中的重尾变现指标。该框架已在 ShareChat 部署,可在减少 45% 流量的情况下达到同等统计置信度。本文已被 SIGIR 2026 收录。

τ-Rec:面向智能推荐系统的可验证基准

Hugging Face Daily Papers

τ-Rec是一个用于智能推荐系统的可验证基准,它用可验证奖励和控制对话约束取代了主观的LLM-as-a-judge评估,揭示了主流模型存在陡峭的可靠性悬崖——即便是表现最佳的模型,其pass@1也仅有约57%。