比人类更环保?大语言模型中的环境态度

arXiv cs.CL 论文

摘要

本文开发了一个用于评估31个大语言模型环境态度的基准,发现它们往往表现出进步的环境观和情境敏感性,凸显了在可持续发展应用中可操控性和规范可靠性的问题。

arXiv:2606.02741v1 公告类型:新 摘要:大型语言模型(LLM)正越来越多地被用于与可持续发展相关的决策支持、报告和公共传播,但关于其输出中所蕴含的环境态度的系统性证据却很少。本文开发了一个评估LLM环境认知、情感和行为建议的基准,并将其应用于31个广泛使用的专有模型和开放权重模型。我们借鉴既定环境意识调查中的问题以及额外的可持续发展相关行为测量指标,比较了1)不同LLM之间的回应,以及2)模型与来自德国的人类调查基准之间的回应。我们评估了它们在不同提示条件下的稳健性。我们发现,许多LLM比平均调查受访者更倾向于环境进步态度,表现出更高的环境情感和认知水平,并推荐与大幅潜在二氧化碳减排相关的行为。同时,我们未观察到可持续发展导向回应与模型来源、规模或发布背景之间存在系统关联。然而,模型表现出情境敏感性,受基于角色的提示控制,并出现迎合用户指定意识形态立场的谄媚性转变,这引发了对其在实际部署中可操控性和规范可靠性的担忧。我们的研究结果提供了一个可重复使用的评估框架,用于评估LLM中与可持续发展相关的价值对齐,并强调了随着AI系统日益嵌入可持续发展转型和公共决策,治理、透明度和关键监督的重要性。
查看原文
查看缓存全文

缓存时间: 2026/06/03 09:35

# 比人类更环保?大型语言模型中的环境态度  
来源:https://arxiv.org/html/2606.02741  

###### 摘要  
大型语言模型(LLMs)越来越多地被用于可持续发展相关的决策支持、报告和公共传播,但关于其输出中蕴含的环境态度,系统性的证据仍然匮乏。本文开发了一个基准,用于评估LLMs中的环境认知、情感和行为建议,并将其应用于31个广泛使用的专有和开源权重模型。基于既有环境意识调查中的问题以及额外的可持续发展相关行为测量,我们将LLM的回答进行两类比较:1)模型之间,2)模型与德国人类调查基准之间。我们评估了它们在不同提示条件下的鲁棒性。研究发现,许多LLM在环境态度上比平均调查受访者更偏向进步立场,表现出更高的环境情感和认知水平,并推荐与显著CO₂减排潜力相关的行为。同时,我们未观察到可持续发展导向的回答与模型来源、规模或发布背景之间存在系统性关系。然而,模型表现出情境敏感性(受基于角色的提示控制)以及迎合用户指定意识形态立场的谄媚性偏移,这引发了对其在实际部署中可操控性和规范可靠性的担忧。我们的研究提供了一个可复用的评估框架,用于评估LLMs中与可持续发展相关的价值对齐,并强调了随着AI系统日益嵌入可持续发展转型和公共决策,治理、透明度和关键监督的重要性。  

代码:https://gitlab.opencode.de/uba-ki-lab/llm-questionnaire-benchmarking-framework  
数据集:https://zenodo.org/records/20445903  

## 引言  
大型语言模型(LLMs)正迅速改变个人和组织感知、评估及应对可持续发展挑战的方式。除了信息检索功能,它们越来越多地被部署为专业领域的副驾驶,包括可持续发展报告。例如,智能体化的LLM能够总结文档、可视化数据,并编写符合正式报告要求的公司报告(Ngee等,2024;Hoang等,2026;Zhang等,2025)。通过这些应用,LLMs可以影响组织的可持续发展行为和决策过程(Bush等,2025)。同时,它们被广泛视为推动可持续发展目标(SDGs)的赋能技术,支持环境分析、知识传播和问题解决(Wang等,2026;Li等,2026;Gohr等,2025;Wu,2026)。  

尽管有这些前景,越来越多的研究指出了当前LLMs在可持续发展语境中同样存在的重大局限性。实证研究记录了多种问题,包括:系统性偏见(van der Ven等,2025;Vida等,2024;Boelaert等,2025)、幻觉(Le Jeune等,2025;Bergener等,2023)、欺骗性行为(Hagendorff,2024)、关于气候变化的虚假信息和阴谋论(Fore等,2024)、事实知识缺口(例如与特定SDGs或SDG间相互作用相关)(Raman等,2024;Bahrami和Srinivasan,2023)、虚假平衡——尽管存在科学共识仍使用两面框架(Zhao等,2026)、模型开发者与提问用户价值观的再生产(即“随机鹦鹉”)(Boelaert等,2025;Bender等,2021),以及“取悦意愿”或谄媚行为(Sharma等,2024;Perez等,2023)。这种现象指模型根据用户信念调整答案,而非给出事实正确的答案(Sharma等,2024)。研究表明,这种“取悦意愿”因来自人类反馈的强化学习而加剧,该过程常奖励用户对齐而非中立性(González Barman等,2025;Perez等,2023)。例如,它可能导致关于气候变化影响的主张被低估或夸大,具体取决于“谁在提问”——正如LLM从气候专家视角回答时所显示的那样(Perez等,2023;Tamang和Zheng,2026)。  

训练数据、模型架构和对齐过程的不透明性进一步增加了评估模型输出反映何种知识主张和价值判断的难度。此外,由于模型主要基于历史数据训练,它们倾向于复现既有叙事和主导观点,可能低估处理紧迫环境问题所需的变革性方法。这些缺陷引发了对LLM辅助可持续发展工作的可靠性和规范性含义的担忧,因为它可能影响用户的环境态度和行为选择。  

新兴研究已开始更明确地分析LLMs中蕴含的环境态度。Wu等(2025)发现,尽管LLMs对单个SDGs表现出事实层面的认知,但在将这些目标置于更广阔的文化和社会背景中理解或推理其相互联系方面,能力弱于人类。Qi等(2025)发现人类受访者与模型生成输出在表达亲环境价值观方面存在显著一致性,而van der Ven等(2025)则识别出聊天机器人回应中的系统性偏见,包括偏好渐进性和技术官僚式的解决方案,并避免将责任归咎于强大的经济行为者。这些发现共同表明,LLMs不仅编码环境知识,还复现了关于可持续性问题和解决方案的特定规范性框架,这与更广泛的证据一致,即LLMs编码了社会嵌入的态度关联和偏见(Omrani Sabbaghi等,2023)。  

文献揭示了一个关键缺口:关于LLMs“知晓”什么环境问题、如何评估这些问题以及它们隐含或明确推荐何种行动,系统性证据仍然有限。填补这一缺口对于理解和塑造LLMs如何影响用户的环境态度、将LLM输出与既定环境框架(如行星边界框架和环境SDGs)对齐,以及评估它们在可持续发展转型中的潜在作用至关重要。  

本研究通过开发并应用一个结构化框架来评估LLMs在三个相互关联维度上的环境态度,从而弥补这一缺口。首先,我们考察环境认知,捕捉关于环境问题和可持续发展原则的事实知识的广度与一致性。其次,我们分析环境情感,通过与环境情感既定项目的同意模式进行操作化。第三,我们评估行为意图和建议,包括支付意愿测量以及与碳排放相关的行为建议,这些建议揭示了关于消费、排放和权衡的隐含态度。我们的项目制定借鉴了德国联邦环境局环境意识研究(UBS)中的工具。我们将该框架应用于31个广泛使用的LLMs,分析它们在环境认知、情感和行为建议方面的系统差异,并探究模型间是否存在任何系统差异。我们聚焦德国背景,并将结果与德国人口纵向调查数据(UBS)的结果进行比较,为LLM输出相对于德国人口层面的态度提供基准。具体而言,我们试图回答以下研究问题:不同LLMs对可持续发展相关问题的回答与德国人口平均水平以及彼此之间存在何种差异?这些发现为技术开发者、用户和政策制定者在更可持续发展导向的LLM开发和使用中带来了哪些挑战与机遇?  

通过整合可持续发展科学、计算机科学和心理学的视角,本文在三个方面为关于LLMs环境影响的日益增长的文献做出贡献。首先,它提供了对LLMs环境态度的结构化实证评估。其次,它引入了一套可复用的可持续发展导向评估工具和测试流程,供未来研究使用。第三,它为政策制定者、用户、公民社会和行业推导出关于LLM的设计、选择和使用如何更好地与环境可持续发展目标对齐的启示。  

## 方法论  
### 研究设计  
为了探究LLMs的环境认知、情感和行为建议,我们探索了多个数据来源和方法论途径。首先,我们将“德国环境意识”(Umweltbewusstsein in Deutschland, UBS)系列研究的问题进行操作化,作为我们分析的基础(Frick等,2026)。UBS自1996年起每两年进行一次,由德国联邦环境部和环境局委托实施,调查德国成年人口的环境意识和行为。2024年轮次采用混合方法(网络、电话和纸质问卷)和分层随机抽样设计,收集了2552名全国代表性样本的数据,涵盖358个变量。UBS采用态度的三要素框架(Spada, 1990),涵盖认知(对环境问题的知识和评估)、情感(情感投入)和行为(基于意图和影响的行动)。因此,我们的研究情境主要聚焦于德国,与UBS的范围保持一致。  

### 认知与情感问题  
在我们的研究中,我们直接采用了17个来自2024年UBS认知和情感类别的问题,未作修改(见附录)。这17个项目自2018年开始收集(另有8个环境行为项目),使得能够为每位受访者计算得分,量表从0(环保意识弱)到10(环保意识强)。其中7个项目测量环境情感,即人们对环境问题的情感反应程度,例如是否因想到留给后代的生存环境状况而感到担忧。另外10个项目涉及环境认知,即人们思考环境问题的方式,例如如何评估环境与自然在其生活质量中的作用,或如何看待资源的可持续利用。狭义的环境知识(即具体的、基于事实的环境知识,如生产一公斤牛肉产生多少温室气体)不包括在UBS的环境认知范畴内。  

### 行为问题:行为建议与CO₂足迹减排潜力  
行为建议源自17个UBS关于可持续发展相关行为的问题。由于LLMs本身并不执行实际行为,我们将行为部分重新定义为行为建议。作为交叉验证,我们进一步增加了7个基于可持续消费能力中心建议的定量问题,该建议本身基于德国环境局的CO₂计算器。这用于引出期望的CO₂排放值,涵盖四个具有重大环境影响的领域:供暖、电力、出行和营养。这七项建议代表可将个人碳足迹减少50%的行为改变。回答通过标准化的排放因子转换为估计的碳足迹(Paar和Tsoutsoulopoulos,2022;Schunkert等,2022),从而允许在模型间进行定量比较。  

### 行为问题:支付意愿(WTP)  
为了探索环境目标与财务成本之间的权衡,我们纳入了11个关于模型支付意愿(WTP)的问题,并大致以行星边界框架为基础(Rockström等,2009)。经济学/心理学中的支付意愿概念探讨个体愿意为某种商品或服务支付多少。我们的问题促使LLMs为减缓环境影响(即二氧化碳、氮和磷的排放,以及淡水系统和生态系统的保护)分配货币价值。对于碳、氮和磷,我们询问了更客观的“经济成本”以及避免这些排放“应该”花费多少。提出WTP问题的理由是评估LLMs在财务与环境目标之间的偏好。  

### 环境态度类型  
环境态度类型源自UBS调查中包含的7个问题(每个问题包含1至17个项目)(Frick等,2026)。对这组问题中的环境态度陈述进行了因子分析,识别出六个不同的因子(包括“支持雄心勃勃的气候政策”)。受访者对这些因子的回答被用作后续聚类分析的基础。所得聚类识别出五种不同的环境态度类型:“坚定型”,他们要求一致的政策并亲自参与环境倡议;“个人可持续型”,他们致力于日常生活中的可持续行为并倡导政府监管;“矛盾型”,他们认识到环境问题但对强有力的环境政策持怀疑态度;“民粹反对型”和“新自由反对型”,他们部分否认气候变化或拒绝环境政策。  

### 构建跨类别指数  
为了增强可比性,我们在上述四个类别(情感、认知、CO₂足迹、支

相似文章

大型语言模型有多像人类?一个关注语域的语言评估框架

arXiv cs.CL

本文提出了一种关注语域的语言评估框架,通过使用最大均值差异(MMD)比较人类与LLM生成文本中67个词汇语法特征的分布,来评估大型语言模型(LLM)的人类相似度。在七个经过指令微调的开源模型和五个语域上的实验表明,没有模型能完美匹配人类基线,且与人类语言的接近程度因语域而异,而非模型规模。

情绪会影响大语言模型的道德判断吗?

arXiv cs.CL

辛辛那提大学的研究人员发现,在提示中加入积极或消极情绪可在约20%的情况下翻转LLM对道德可接受性的判断,揭示出模型与人类在情绪驱动对齐上的差距。

赋予角色的大型语言模型表现出类似人类的动机推理

arXiv cs.CL

本文研究了为大语言模型赋予角色是否会引发类似人类的动机推理,发现赋予角色的大语言模型真实性辨别能力最多下降9%,并且以与其诱导的政治身份一致的方式评估科学证据的可能性最多增加90%,而基于提示的去偏见方法基本无效。