国际人道法中的直接因果关系与人工智能中介的平民网络行动挑战
摘要
本文探讨了人工智能中介的平民网络行动如何挑战红十字国际委员会(ICRC)关于直接参与敌对行动测试中的直接因果关系标准,认为自主多智能体系统打破了国际人道法分类所需的因果联系。
arXiv:2606.29175v1 Announce Type: new
摘要:国际人道法保护平民免受直接攻击,除非且仅在平民直接参与敌对行动期间,红十字国际委员会(ICRC)2009年《解释性指南》通过三项累积标准来实施该规则。本文认为,人工智能中介的平民网络行动以一种结构特定的方式挑战了这一测试中的直接因果关系要素:当平民部署近期在进攻性人工智能研究中展示的那种自主多智能体网络系统时,“一步因果”标准失效,因为伤害是由人类脱离后系统生成的决定产生的;而“组成部分”要求则无法延伸,因为它预设了存在可以独立分类的下游人类贡献者。因此,该框架默认将此类部署视为间接参与,这与其意在捕获亲自参与敌对行动的平民的目的相矛盾。除了学理分析外,本文还将目标规范粒度识别为“组成部分”测试具体性部分隐含依赖的属性,将人工智能中介的行动按五级谱系分类,并指出现有技术性人工智能治理工具并未记录或报告该属性。
查看缓存全文
缓存时间: 2026/06/30 05:32
# 国际人道法中的直接因果关系与AI中介平民网络行动带来的挑战 来源:https://arxiv.org/html/2606.29175 Alice Saito 东京大学文理学院 日本东京 alicesaito14@g\.ecc\.u\-tokyo\.ac\.jp &Harold Godsoe Kojima法律事务所 日本东京 godsoe@kojimalaw\.jp &Phan Xuan Tan 芝浦工业大学工学部 日本东京 tanpx@shibaura\-it\.ac\.jp ###### 摘要 国际人道法保护平民免受直接攻击,除非且仅在平民直接参加敌对行动之时,红十字国际委员会2009年《解释性指南》通过三项累积标准测试将这一规则具体化。本文认为,AI中介的平民网络行动以结构性特定的方式挑战了这一测试中的直接因果关系要素:当平民部署一种最近在进攻性AI研究中展示的自主多智能体网络系统时,"一个因果步骤"标准失效,因为伤害是在人类脱离后由系统生成的决策产生的;而"组成部分"要求也无法扩展,因为它预设了下游的人类贡献者,其行为可被独立分类。因此,该框架默认将此类部署视为间接参加,这与框架旨在捕捉亲自参加敌对行动的平民的目的相悖。除法律分析外,本文识别出目标指定粒度是组成部分测试的具体性要素隐含依赖的属性,将AI中介行动按五级光谱分类,并指出现有技术性AI治理工具未记录或报告该属性。 ## 1 引言 区分原则要求武装冲突各方在任何时候都区分平民与战斗人员,并只针对后者发动攻击。这是国际人道法的基本规则之一。如Mačák (2023 (https://arxiv.org/html/2606.29175#bib.bib12))所述,该原则"位于国际人道法的核心",是许多规则的基础。直接参加敌对行动原则是区分原则对单个平民发挥作用的机制:平民免受直接攻击,除非且仅在直接参加敌对行动之时(第一附加议定书第51条第3款;第二附加议定书第13条第3款)。当该原则运作良好时,它提供了一种共同的分类方案,使利益冲突深重的各方能够协调克制。每一方都避免针对平民,期望另一方也将如此,而对谁算作平民参加者的分类足够稳定,即使在相互不信任的条件下也能维持这种协调。本文表明,特定类别的AI中介网络行为通过切断该原则赖以识别参加者的因果联系,破坏了这种协调,并孤立出导致破坏的可测量系统属性。 红十字国际委员会2009年《解释性指南》(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14))通过三项累积标准测试将直接参加敌对行动规则具体化:伤害门槛、直接因果关系和交战联系。伤害门槛涉及行为的可能效果;交战联系涉及行为支持一方对抗另一方的目的。本文仅聚焦于直接因果关系要素,即要求平民的行为与产生的伤害之间存在足够密切的因果联系。选择聚焦于直接因果关系反映了该要素的结构重要性:伤害门槛和交战联系标准关注行为的特征与目的,而直接因果关系关注平民行为与其产生的伤害之间的关系。这种关系正是AI中介网络行动对法律框架产生最独特压力的地方。 本文认为,正如在俄乌冲突中涌现并由近期进攻性AI研究预示的AI中介平民网络行动,正积极挑战直接参加敌对行动框架的直接因果关系要素。论证通过三个场景展开,涵盖人类因果参与的不同程度:行为体使用语言模型起草攻击工具;黑客活动者在逐行为人类批准下运行自主利用框架;以及黑客活动者仅在配置后部署完全自主的多智能体利用系统。前两个案例符合框架的现有逻辑。第三个案例则不然:"一个因果步骤"标准失效,"组成部分"要求无法跨越人机边界延伸,框架的默认分类将其与科学研究和武器生产并列,这一结果在实质上与框架的目的相悖。 直接因果关系的压力还带来进一步的后果。由于框架无法识别参加行为,"只要参加期间"的时间边界便无所依附,从而同样瓦解。压力的根本来源是结构性的:框架的法律工具都预设平民行为下游存在可识别的、框架可分类的人类行为体,而AI中介网络行动消除了这些行为体。本文不尝试全面处理伤害门槛、交战联系或可能的治理方案。这些问题留待进一步研究。 本文做出三项贡献。首先,法律分析表明,对于自主多智能体部署,直接参加敌对行动的直接因果关系要素以结构性特定的方式失效。其次,识别出目标指定粒度——即人类在配置和启动系统时固定了多少操作决策——是组成部分测试的具体性要素隐含依赖的属性。第三,对现有技术性AI治理工具针对该属性进行评估,表明即使下游法律分类需要该属性,这些工具也未记录或报告它。除法律分析外,本文精确定位了随着自主系统扩散,法律框架需要进行更新的具体位置:如果缺乏对人类在配置时固定了多少操作内容这一度量,组成部分测试的具体性要素就无法运作。 本文其余部分组织如下。第2节 (https://arxiv.org/html/2606.29175#S2)介绍国际人道法法律框架,第3节 (https://arxiv.org/html/2606.29175#S3)介绍平民网络参与和进攻性网络AI能力的实证背景。第4节 (https://arxiv.org/html/2606.29175#S4)描述AI中介平民网络行为的三种场景。第5节 (https://arxiv.org/html/2606.29175#S5)将直接因果关系框架应用于这些场景并识别结构性压力。第6节 (https://arxiv.org/html/2606.29175#S6)引入目标指定粒度作为度量概念,并评估现有技术性AI治理工具。第7节 (https://arxiv.org/html/2606.29175#S7)讨论对区分原则的后果。第8节 (https://arxiv.org/html/2606.29175#S8)总结。 ## 2 法律框架 ### 2.1 区分原则与直接参加敌对行动例外 根据国际人道法——规范武装冲突的法律体系——平民免受直接攻击,除非且仅在直接参加敌对行动之时(第一附加议定书第51条第3款;第二附加议定书第13条第3款)。区分原则要求武装冲突各方在任何时候都区分战斗人员与平民,并只能直接攻击战斗人员。这是国际人道法的基本规则之一,而保护平民免受直接攻击是其核心操作后果。直接参加敌对行动原则是国际人道法确定单个平民何时丧失这种保护的机制。适用此框架需要两个定义。第一个是敌对行动,定义为冲突各方集体诉诸伤害敌人的手段和方法(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第43页)。第二个是直接参加,指个人具体参与敌对行为,区别于战争的一般行为。 ### 2.2 红十字国际委员会三项累积标准测试 红十字国际委员会《解释性指南》(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14))将这一规定具体化为一套三部分累积测试。第一个构成要素是伤害门槛。行为必须可能对冲突一方的军事行动或军事能力产生不利影响,或者可能导致受保护人员或物体死亡、受伤或破坏。第二个要素是直接因果关系。具体行为与预期伤害之间必须存在足够密切的因果联系。第三个要素是交战联系;行为必须专门旨在支持冲突一方或损害另一方。所有三个要素必须同时满足,才能使行为构成直接参加敌对行动。就本文而言,所有场景均设定并通过伤害门槛和交战联系。 表1:《解释性指南》承认的平民行为,以及每个行为的内部/外部位置。 ### 2.3 《解释性指南》下的直接因果关系 《解释性指南》通过一个统一测试处理直接因果关系,该测试可通过两个不同的分支之一得到满足。如果任一分支满足,则存在直接因果关系。 首先,直接因果关系要求"所产生的伤害必须通过平民行为的'一个因果步骤'带来"(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第53页)。其次,由于现代军事行动通常是集体性的且技术分布广泛,《解释性指南》用一项解释补充"一个因果步骤"规则,允许在集体行动中共同直接因果关系。如果某一具体行为本身不能直接造成所需的伤害门槛,但该行为构成"直接造成此类伤害的具体协调战术行动的组成部分",则仍满足要求(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第54页)。指南中列举的典型例子是无人机打击,可能同时涉及通过遥控操作无人机的计算机专家、照亮目标的人员、收集数据机组成员、控制导弹发射的专家、传输命令的无线电操作员以及一名总指挥官;所有这些人都直接参加敌对行动,尽管只有少数人的行为孤立来看会直接造成伤害(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第54页)。梅尔策对集体行动的处理使得该框架能够应对技术中介、地理分布广泛且时间延长的行动,而无需将除扳机扣动者之外的所有贡献者都排除在法律后果之外。 那些仅仅是建立或维持一方伤害敌人能力的行为被排除在直接参加之外,因为它们仅间接造成伤害,即使对于最终伤害的发生必不可少(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第53-54页)。根据《解释性指南》的明确处理,这包括科学研究和设计、武器生产和运输(除非作为具体军事行动的组成部分实施)、人员招募和训练以及实施经济制裁。 在两个测试分支中,不可或缺性均不构成直接因果关系。直接因果关系不是"若无则不"测试。梅尔策明确指出,武器的融资或生产可能对伤害不可或缺但不具有直接因果关系,而在伏击中担任瞭望的平民则直接参加,尽管其贡献可能并非不可或缺(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第54页)。行为与其后果通过不间断因果链相连也不足以满足要求。组装或走私简易爆炸装置的组件不直接造成伤害,但放置和引爆装置则直接造成伤害(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第54页)。 《解释性指南》还明确指出,与最终伤害的时间或地理接近仅是指示性的,而非两个测试分支中直接因果关系的构成要素。满足任一分支的行为,即使通过延迟或远程手段进行,无论平民行为与所产生的伤害在时间或空间上相距多远,仍具有直接因果关系(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第55页)。地雷、诡雷、定时控制装置、远程控制导弹、无人机和计算机网络攻击均可满足直接因果关系,无论与最终伤害的距离多远(Melzer,2009 (https://arxiv.org/html/2606.29175#bib.bib14),第55页)。该框架特意构建以容纳技术中介、时间延长的行动。同样,区别不在于确定性系统与非确定性系统。地雷和诡雷在其与所造成伤害的联系中具有随机性,但仍被涵盖为直接因果关系。 对后续论证有用的一个分析视角是:所考虑的平民是处于产生伤害操作决策的系统内部(内生),还是外部(外生)。《解释性指南》并未以这些术语构建其分类,但这种区别跟踪了其中的模式。直接因果关系涵盖了内生邻近情况(如扳机扣动者)和内生远程情况(如地雷或诡雷,平民将操作决策编码到随后执行的装置中)。集体共同直接因果关系涵盖了内生情况,即平民是若干贡献者之一,其联合行为构成该行动。能力建设则属于外生一侧:资助者、运输者和组件组装者处于伤害操作决策系统之外。 ## 3 实证背景 ### 3.1 俄乌冲突中的平民网络参与 俄乌冲突产生了首次大规模有组织的平民在武装冲突中的网络参与。2022年2月26日,即俄罗斯入侵两天后,乌克兰数字化转型部长米哈伊洛·费多罗夫公开呼吁志愿者加入后来被称为"乌克兰IT军"的组织,这是一个通过Telegram协调的黑客活动组织,数周内达到约30万订阅者(Soesanto,2022 (https://arxiv.org/html/2606.29175#bib.bib21))。IT军运作双重结构:面向公众的一方通过Telegram向志愿者分发DDoS目标和工具,以及一个可能与乌克兰国防和情报机构有关联的内部团队。目标由管理员每周发布两到三次。
相似文章
与AI共行动:基于交互的代理侵权责任框架
本文提出了一种基于交互的框架,用于在代理型AI系统造成损害时分配侵权责任。该框架借鉴了布拉特曼的规划理论和普通法中的共同行动原则,将人机交互类型映射到现有的侵权责任规则上。
AI战争已经来临
本文探讨了人工智能如何深入融入军事行动,从Maven项目到当前关于自主武器和红线的辩论,突显了从假设的杀人机器人向现实世界中AI赋能战争的转变。
未来AI网络战?
关于生成式AI如何加速网络战的推测性讨论,AI代理既攻击又防御,可能导致自主武器系统和升级风险。
AI 安全的 geopolitics:区域大语言模型偏差的因果分析
本文引入了一个概率图模型框架,以因果方式审核大语言模型(LLM)的安全机制,揭示出由于忽视了语境的毒性,标准的观测指标高估了人口统计学偏差。
人工智能与全球安全
本文讨论了人工智能对全球安全的影响,涵盖了人工智能在战争、网络安全以及国际政策考虑等方面的内容。