从碎片化ESG数据中获取可审计的气候风险智能:面向范围1-3验证的确定性编排与不平衡感知学习
摘要
本文提出了一种确定性气候风险智能框架,整合了编排、异常检测和不平衡感知集成学习,用于可审计的ESG验证,以解决碎片化的范围1-3报告数据。
arXiv:2606.02604v1 公告类型:新
摘要:ESG和气候风险数据在异构的范围1、范围2和范围3报告环境中仍然碎片化,而传统的验证流程缺乏来源感知的可审计性、隐藏漂移检测以及面向可重现性的治理。本文提出了一种确定性气候风险智能框架,整合了单一真相来源编排、时间异常检测、不平衡感知集成学习和面向可解释性的治理,用于可审计的ESG验证。为支持开放重现性,我们构建并发布了一个合成ESG验证基准,该基准根据GHG Protocol、PCAF和ISSB标准的公开报告特征进行校准。该方法整合了时间漂移分析、基于SMOTE的稀有事件优化、集成学习、来源感知编排以及基于TreeSHAP的可解释性,用于治理检查和审计重构。我们使用分类指标(召回率、F1、ROC AUC)、校准指标(ECE、Brier分数)以及面向治理的审计追踪完整性度量(衡量可重构确定性来源到升级溯源链的标记异常比例),将该框架与统计分类器、异常检测方法、时间预测基线以及基于阈值的系统进行了评估。结果以分层五折交叉验证的均值和标准差及配对显著性检验报告。该框架将ESG报告重新定义为支持可重现性、可解释性和操作可审计性的确定性气候风险治理基础设施。
查看缓存全文
缓存时间: 2026/06/03 09:38
# 从碎片化ESG数据到可审计的气候风险智能:面向范围1-3验证的确定性编排与不平衡感知学习 来源:https://arxiv.org/html/2606.02604 Karan Sehgal 肯特商学院,肯特大学,坎特伯雷,英国 K\.Sehgal@kent\.ac\.uk & Khawar Naveed Bhatti 肯特商学院,肯特大学,坎特伯雷,英国 K\.Bhatti@kent\.ac\.uk ###### 摘要 追求净零承诺的企业日益面临系统性工程挑战:ESG与气候风险数据在异质的范围1、范围2和范围3报告环境中仍然碎片化,而传统的验证流程缺乏来源感知的可审计性、隐式漂移检测以及面向可复现性的治理能力。 本文提出一个确定性的气候风险智能框架,整合单一事实来源编排、时间异常检测、不平衡感知集成学习以及面向可解释性的治理体系,用于构建可审计的ESG验证基础设施。 为支持开放可复现性,我们构建并发布一个合成ESG验证基准,其披露分布、异常流行率及缺失结构均根据公开报告的GHG Protocol、PCAF和ISSB报告标准特征进行校准。所提出的工作流将该基准与公开的气候风险灾害数据集、代理排放特征以及符合会计逻辑的数据质量逻辑相结合,置于一个确定性事件驱动编排管道中,旨在提升验证可追溯性与治理可靠性。 该方法包含时间漂移分析、基于SMOTE的罕见事件优化、集成学习架构、来源感知编排语义以及基于TreeSHAP的可解释性,用于治理审查与审计重建。 比较实验评估了该框架相对于统计分类器、异常检测方法、时间预测基线以及基于阈值的验证系统的性能,使用分类指标(召回率、F1、ROC-AUC)、校准指标(期望校准误差、Brier分数)以及一个面向治理的*审计痕迹完整性*指标,该指标衡量能够重建确定性来源到升级链的已标记异常比例。结果以分层五折交叉验证的均值与标准差形式报告,并针对最强基线进行配对显著性检验。 所提出的工作流将ESG报告从被动的披露聚合重新定义为确定性的气候风险治理基础设施,支持受监管企业环境中的可复现性、可解释性与操作可审计性。 ## 1 引言 追求净零承诺的企业日益在碎片化的ESG报告环境中运营,涉及分布在供应商、财务系统、可持续发展平台以及地理多样的报告基础设施中的异质范围1、范围2和范围3披露系统。 传统的ESG验证工作流通常依赖于被动提取、基于阈值的对账程序以及人工密集的审计流程,缺乏确定性编排语义、来源感知可追溯性以及面向可复现性的治理工程。 在受监管的企业环境中,这些局限性变得越来越显著,因为气候风险披露影响着机构报告义务、融资排放核算、操作风险评估以及可持续性相关的财务决策。 此外,企业气候风险环境表现出稀疏的异常分布和高度不平衡的操作条件,表示为: P\(y=1\)≪P\(y=0\)P\(y=1\)\\ll P\(y=0\) 其中,治理关键异常仅占全部报告观测的一小部分。 在此条件下,传统优化程序可能产生看似强大的整体性能,但在治理关键边缘情况下表现出弱的少数事件敏感性和高的假阴性行为。 此外,ESG报告系统仍然容易受到以下影响: - •来源不一致, - •供应商披露延迟, - •气候转型漂移, - •隐性对账冲突, - •以及不完整的排放报告。 本文提出一个确定性的气候风险智能框架,整合: - •确定性编排, - •来源感知治理, - •时间漂移检测, - •不平衡感知集成学习, - •以及面向可解释性的审计基础设施。 所提出的工作流将异质ESG报告环境、气候风险灾害数据集、时间异常建模以及面向治理的可解释性机制整合到一个可复现感知的编排架构中,旨在提高碎片化企业披露条件下的审计性与操作可靠性。 更广泛的目标是将ESG报告从被动的披露聚合转变为支持可信气候风险智能基础设施的确定性治理工程。 本文的主要贡献总结如下: - •一个适用于碎片化企业报告环境中来源感知ESG验证的确定性编排框架。 - •一个结合SMOTE优化、集成学习和时间异常检测的不平衡感知气候风险智能工作流。 - •一个面向治理的可解释性架构,结合基于TreeSHAP的可解释性与审计重建和来源感知可追溯性。 - •一个*审计痕迹完整性*指标,量化标记异常的确定性来源重建,使治理工程目标可直接测量。 - •一个面向可复现性的实验框架,包含校准的合成ESG基准、气候风险增强、时间漂移建模、交叉验证评估以及治理敏感指标。 参考图示图1:确定性气候风险智能架构,整合来源感知编排、不平衡感知学习、时间来源图建模以及面向治理的可解释性,用于ESG验证基础设施。 ## 2 相关工作 ### 2\.1 ESG报告与气候风险治理 在GHG Protocol、PCAF、TCFD、ISSB和CSRD等治理框架下,企业气候风险报告发展迅速Greenhouse Gas Protocol \(2023 (https://arxiv.org/html/2606.02604#bib.bib18)\); Partnership for Carbon Accounting Financials \(2022 (https://arxiv.org/html/2606.02604#bib.bib12)\); International Sustainability Standards Board \(2023 (https://arxiv.org/html/2606.02604#bib.bib13)\)。 这些框架建立了面向会计的披露要求,但在确定性编排、来源感知验证和面向可复现性的治理工程方面提供的技术指导相对有限。 近年来的气候风险系统越来越多地整合NGFS转型情景、哥白尼气候基础设施、WRI Aqueduct灾害数据集以及ThinkHazard环境风险情报,用于企业压力测试和气候暴露建模Network for Greening the Financial System \(2023 (https://arxiv.org/html/2606.02604#bib.bib14)\); European Centre for Medium\-Range Weather Forecasts \(2023 (https://arxiv.org/html/2606.02604#bib.bib15)\); World Resources Institute \(2023 (https://arxiv.org/html/2606.02604#bib.bib16)\); Global Facility for Disaster Reduction and Recovery \(2023 (https://arxiv.org/html/2606.02604#bib.bib17)\)。 然而,现有的ESG验证工作流仍然严重依赖于静态的对账程序,缺乏时间异常意识、面向治理的编排语义以及确定性审计重建。 ### 2\.2 气候风险智能的机器学习 包括随机森林Breiman \(2001 (https://arxiv.org/html/2606.02604#bib.bib1)\)、梯度提升、XGBoostChen and Guestrin \(2016 (https://arxiv.org/html/2606.02604#bib.bib3)\)、LightGBMKeet al\.\(2017 (https://arxiv.org/html/2606.02604#bib.bib4)\)和CatBoostProkhorenkovaet al\.\(2018 (https://arxiv.org/html/2606.02604#bib.bib5)\)在内的机器学习架构在非线性企业风险环境下已展现出强大的预测能力。 近期工作还探索了使用集成学习架构进行排放估算、气候风险预测和治理敏感异常检测。 然而,治理关键的ESG失败仍然相对稀疏且操作上不平衡,常常在传统优化工作流下产生不稳定的少数事件敏感性和高的假阴性行为。 因此,不平衡感知学习程序(包括SMOTEChawlaet al\.\(2002 (https://arxiv.org/html/2606.02604#bib.bib2)\))对于碎片化企业报告环境下的治理导向异常检测仍然至关重要。 ### 2\.3 概念漂移与时间不稳定性 企业ESG报告系统还表现出时间不稳定性,涉及延迟披露、供应商波动、不断演变的可持续性标准以及气候转型不确定性。 先前关于概念漂移和自适应学习的研究强调了在持续演变的企业系统中进行时间感知验证和非平稳异常建模的重要性Gamaet al\.\(2014 (https://arxiv.org/html/2606.02604#bib.bib8)\)。 时间治理退化可能通过以下方式出现: - •概念漂移, - •协变量漂移, - •标签漂移, - •以及报告频率不稳定性。 这些形式的时间不稳定性在运行于不断演变的监管和环境条件下的气候风险智能系统中变得尤为重要。 ### 2\.4 可解释性与可信AI 面向可解释性的方法论(包括SHAPLundberg and Lee \(2017 (https://arxiv.org/html/2606.02604#bib.bib6)\)及其树集成特化版TreeSHAPLundberget al\.\(2020 (https://arxiv.org/html/2606.02604#bib.bib19)\))已成为提升企业AI透明度、审计重建和治理审查的重要机制。TreeSHAP在此特别相关,因为它能在低阶多项式时间内为基于树的模型计算精确的Shapley值,从而使得在本文使用的高维特征空间中进行归因变得可行。 近期可信AI治理框架,包括NIST AI风险管理框架National Institute of Standards and Technology \(2023 (https://arxiv.org/html/2606.02604#bib.bib10)\)、OECD可信AI原则Organisation for Economic Co\-operation and Development \(2022 (https://arxiv.org/html/2606.02604#bib.bib11)\)以及面向可复现性的机器学习指南Pineauet al\.\(2021 (https://arxiv.org/html/2606.02604#bib.bib9)\),还强调了校准可靠性、操作可复现性、治理感知监督以及审计一致性。 然而,可解释性本身并不能保证确定性编排、来源感知治理或面向可复现性的审计基础设施。 因此,本文将可解释性定位为更广泛的确定性治理工程架构中的一个组成部分,用于构建可信气候风险智能系统。 ## 3 数据集与问题设定 ### 3\.1 校准的合成ESG基准 为在不披露商业敏感企业记录的情况下实现开放、完全可复现的实验,我们构建并发布一个*合成*ESG验证基准。该基准由有文档记录的数据生成过程(DGP)生成,而非从单一专有系统中提取;这一设计选择以完全可复现性、公开可用性和可控异常流行率为代价,摒弃了现实世界的特异性。合成基准测试是治理敏感领域的标准实践,因为生产数据无法共享。 DGP分为四个阶段。首先,基础披露记录从范围1、范围2和范围3字段中采样,其边缘分布和缺失率根据公开报告的GHG Protocol、PCAF和ISSB报告标准特征进行校准Greenhouse Gas Protocol \(2023 (https://arxiv.org/html/2606.02604#bib.bib18)\); Partnership for Carbon Accounting Financials \(2022 (https://arxiv.org/html/2606.02604#bib.bib12)\); International Sustainability Standards Board \(2023 (https://arxiv.org/html/2606.02604#bib.bib13)\)。其次,为每条记录附加来源元数据、置信区间和时间报告信号。第三,以受控流行率注入第4节(https://arxiv.org/html/2606.02604#S4)中定义的六种治理故障模式,以生成带标签的治理异常。第四,用公开气候风险指标(第3\.3节(https://arxiv.org/html/2606.02604#S3\.SS3))丰富记录。因此,异常标签与故障注入过程共同生成,为评估提供了确切的真实标签。基准、生成代码和固定随机种子均已发布以支持可复现性(第5\.11节(https://arxiv.org/html/2606.02604#S5\.SS11))。 ### 3\.2 企业ESG验证层 基准的企业验证层模拟了异质的ESG报告系统,涉及: - •范围1排放, - •范围2披露, - •范围3供应商报告, - •来源元数据, - •置信区间, - •以及审计对账状态。 核心字段包括排放变量、治理元数据、来源标识符、时间报告信号、区域指标以及气候风险严重性属性。 ### 3\.3 公开气候风险层 为支持面向可复现性的实验,整合了公开气候风险数据集,包括: - •WRI Aqueduct 4\.0, - •ThinkHazard, - •哥白尼气候变化服务, - •NGFS转型情景, - •以及符合PCAF的排放逻辑。 这些数据集提供洪水风险、干旱暴露、热应激、转型风险以及行业气候脆弱性指标。 表1:合成ESG基准汇总统计量 ## 4 治理故障模式 碎片化的ESG报告环境经常表现出治理关键的不一致性,可能降低审计可靠性、气候风险可见性和企业报告完整性。 因此,所提出的框架将异常检测建模为一个面向治理的验证问题,涉及多个操作故障类别。这些类别还定义了用于标记合成基准(表1(https://arxiv.org/html/2606.02604#S3\.T1))的故障注入过程。 表2:治理故障模式这些治理故障类别为气候风险智能系统中的异常检测、审计重建和来源感知编排提供了操作基础。 ## 5 框架架构 本节描述所提出的确定性气候风险智能框架的组成部分。我们首先介绍自然语言摄取层和时间漂移层,然后是确定性编排、来源推理、符号-神经治理、不平衡感知学习和可解释性组件。 ### 5\.1 自然语言ESG摄取 现实世界的ESG报告环境经常涉及异质的非结构化披露,包括可持续性报告、收益报表、供应商披露、监管文件、气候
相似文章
ESGLens:基于LLM的RAG框架,实现交互式ESG报告分析与评分预测
MIT研究人员提出ESGLens,一个RAG框架,可从PDF报告中提取结构化ESG数据,并以0.48的Pearson相关系数预测环境评分,对标LSEG基准。
当无基准存在时:验证无真实标签的LLM安全评分比较
本文介绍了一个框架,用于在没有真实标签的情况下验证LLM安全评分比较,通过使用'工具有效性链'来建立部署证据。该方法通过一个名为SimpleAudit的本地优先工具在挪威安全包上进行了演示,并比较了Borealis和Gemma 3等模型。
基准审计中的可靠性差距:分布偏移与规模作为污染检测的失效模式
本文识别出分布偏移和规模约束是LLM基准审计中统计污染检测方法的关键失效模式。对27个模型评估三种范式的结果显示,在335次评估中仅有199次正确结果,表明存在系统性可靠性差距,使得这些方法无法替代透明数据溯源。
DeXposure-Claw: 一种用于DeFi风险监管的智能体系统
介绍了DeXposure-Claw,一个基于预测的智能体系统,用于DeFi风险监管。该系统使用图时间序列基础模型来预测风险敞口网络,并通过确定性监控器与置信门来约束LLM生成的监管工单。同时提出了DeXposure-Bench,一个六维评估框架,用于与监管目标一致的评估。
SciRisk-Bench:面向AI4Science安全的风险维度感知基准
本文介绍了SciRisk-Bench,这是一个用于在AI4Science场景下评估大语言模型安全的基准,涵盖7个学科、31个子学科和10个风险维度,以同时评估科学能力和风险意识。