循环中的声音:绘制参与式人工智能图谱

arXiv cs.AI 论文

摘要

本文提出了一个可复现的协议,用于构建参与式人工智能项目的开放存储库和交互式地图集,分析了131条记录以揭示地理和生命周期模式,并提出了一个默认参与式人工智能基础设施的框架。

arXiv:2605.16827v1 Announce Type: new 摘要:参与式人工智能方法在公共、公民和人道主义环境中日益被记录,但关于参与如何组织的证据仍然碎片化。本文报告了一个开放存储库和参与式AI倡议交互式地图集的构建,使用了来自Maga~na和Shilton的Trustworthy AI语料库统一后的记录,以及来自研究和实践的额外审计案例。我们贡献了三个要素。首先,我们指定了一个可复现的协议,用于参与式AI记录的发现、审查、统一、地理编码、来源追踪以及基于发布的出版。其次,我们报告了语料库层面的模式,涉及地理分布、参与层级、生命周期节点、组织形式、验证状态以及剩余的文件缺口。已记录的倡议仍然集中在少数国家,而参与最常见的是在问题制定、评估和治理阶段编码,而不是模型开发或训练阶段。第三,我们展示了该地图集如何通过版本化发布、记录链接的问题和注释渠道、模式反馈工作流以及编辑或限制披露请求,来操作化一个默认参与式AI基础设施的设计和治理框架。该地图集旨在通过一个可更新、可争议和可复用的活清单,支持比较研究、政策学习和社区审查。
查看原文
查看缓存全文

缓存时间: 2026/05/19 06:36

# 循环中的声音:绘制参与式人工智能

来源:https://arxiv.org/html/2605.16827
Rashid Mushkani

\(2026\)

###### 摘要。

在公共、公民和人道主义领域,关于人工智能的参与式方法正日益得到记录,但关于参与如何组织的证据仍然零散。本文报告了一个开放存储库和交互式参与式人工智能项目地图集的构建过程,该地图集使用了从 Magaña 和 Shilton 的可信人工智能语料库中统一整理的 131 条记录,以及来自研究和实践的其他经过审核的案例。我们贡献了三个要素。首先,我们详细说明了一个可重复的协议,用于参与式人工智能记录的发现、审核、统一、地理编码、来源追踪和基于版本发布的出版。其次,我们报告了在地理分布、参与层级、生命周期节点、组织形式、验证状态以及剩余文档缺口方面的语料库层面模式。有记录的项目仍然集中在少数几个国家,而参与最常见的是在问题制定、评估和治理环节,而非模型开发或训练环节。第三,我们展示了该地图集如何通过版本化发布、记录链接的问题和注释渠道、模式反馈工作流程以及编辑或限制性披露请求,具体化了一种默认参与式人工智能基础设施的设计与治理框架。该地图集旨在通过一个可以更新、质疑和重复使用的活清单,支持比较研究、政策学习和社区监督。

参与式人工智能,公共利益技术,人工智能治理,注册中心,文档编制,绘图研究

††期刊年份:2026††版权:cc††会议:2026 年 ACM 公平、问责与透明度会议;2026 年 6 月 25–28 日;加拿大魁北克省蒙特利尔市††论文集:2026 年 ACM 公平、问责与透明度会议 (FAccT ’26),2026 年 6 月 25–28 日,加拿大魁北克省蒙特利尔市††ccs:应用计算 治理††ccs:应用计算 法律、社会和行为科学††ccs:计算方法 机器学习

## 1. 引言

人工智能系统在决策备受争议、影响分布不均、且关于当地情况的知识由开发团队之外的行为者掌握的环境中得以开发和部署。作为回应,公共机构、公民组织和研究人员采用了参与式方法,旨在将受影响的利益相关者纳入人工智能赋能系统的设计、评估和治理中。此类工作借鉴了参与式设计和民主治理的传统,这些传统将参与视为决策影响力的问题,而非仅仅是咨询问题(Arnstein, 1969 (https://arxiv.org/html/2605.16827#bib.bib1); Schuler and Namioka, 1993 (https://arxiv.org/html/2605.16827#bib.bib4); Fung, 2006 (https://arxiv.org/html/2605.16827#bib.bib5); Robertson and Simonsen, 2012 (https://arxiv.org/html/2605.16827#bib.bib6); Mushkani, 2026 (https://arxiv.org/html/2605.16827#bib.bib2))。在人工智能研究和实践中,参与式方法被讨论为改善问题制定、数据实践和问责制的途径,同时也引发了关于剥削性参与和“参与式洗白”的担忧(Sloane 等, 2022 (https://arxiv.org/html/2605.16827#bib.bib8); Birhane 等, 2022 (https://arxiv.org/html/2605.16827#bib.bib9); Irani, 2019 (https://arxiv.org/html/2605.16827#bib.bib13); Mushkani 等, 2025 (https://arxiv.org/html/2605.16827#bib.bib3))。在本文中,我们的焦点是*为了*人工智能的参与:即塑造人工智能系统设计、部署或监督的参与式安排。我们仅当人工智能系统本身通过此类机制进行治理时,才包含“用于参与的人工智能”;仅仅支持会议、咨询或翻译而不影响人工智能系统自身设计或治理的工具,则不在此范围。

公共部门对机器学习的采纳扩大了这些问题出现的场景范围。算法工具被用于分配服务、定位检查以及确定行政优先事项,包括在城市治理和社会服务提供中。先前的工作记录了当制度约束和政治选择被视为技术参数时,数据驱动的系统如何可能加剧现有不平等(Eubanks, 2018 (https://arxiv.org/html/2605.16827#bib.bib34); Selbst 等, 2019 (https://arxiv.org/html/2605.16827#bib.bib14))。因此,治理回应结合了对算法系统透明度的要求,以及关于是否、如何以及在何种条件下使用此类系统的决策参与的要求(Wieringa, 2020 (https://arxiv.org/html/2605.16827#bib.bib35); Kitchin, 2017 (https://arxiv.org/html/2605.16827#bib.bib36))。在此环境下的参与不仅限于用户体验设计;它包括制度机制,如监督委员会、劳工代表、社区数据治理以及质疑自动决策的渠道。

尽管参与式主张不断增长,但参与式人工智能的整体格局仍然难以把握。文档分散在项目网站、学术出版物、政府门户网站和灰色文献中,术语迥异,基本元数据报告也不一致。其结果是证据基础零散,阻碍了比较研究,妨碍了跨领域学习,并使社区和政策制定者难以识别相关先例。在城市治理中,由于缺乏系统性可见性,促使了算法注册中心和透明度标准的发展,这些标准发布关于公共机构使用的算法工具的结构化信息(阿姆斯特丹市, 2022 (https://arxiv.org/html/2605.16827#bib.bib29); 赫尔辛基市, 2020 (https://arxiv.org/html/2605.16827#bib.bib27); 英国中央数字和数据办公室, 2023 (https://arxiv.org/html/2605.16827#bib.bib28); Digital Forum Lab 和 Eurocities, 2022 (https://arxiv.org/html/2605.16827#bib.bib30))。在人道主义和公民技术领域也出现了类似问题,项目周期短、资助方变动频繁以及存档能力有限,导致了机构记忆的丧失和试点项目之间的可比性受限(Berditchevskaia 等, 2021 (https://arxiv.org/html/2605.16827#bib.bib22); Meier, 2015 (https://arxiv.org/html/2605.16827#bib.bib21))。

本文通过构建一个开放存储库和交互式地图集来应对这些限制,该地图集汇集了截至 2026 年初的公开文档中的参与式人工智能项目。该存储库被设计为一个活的基础设施,而非静态目录。它旨在支持持续的补充、修正以及关于参与主张在实践中如何运作的讨论。

我们的实证焦点是 131 个项目。该数据集统一整理了 Magaña 和 Shilton 报告的 95 个项目的可信人工智能语料库(Magaña and Shilton, 2025 (https://arxiv.org/html/2605.16827#bib.bib45))中的记录,以及在研究和实践文档中进行的额外审核搜索。由于记录可能通过不止一条发现路径进入,我们将该语料库视为一个整体集合,而非按来源划分。

在整个语料库中,我们整理了地理空间、文档以及参与特定元数据,以支持全球地图视图和比较分析,分析参与在人工智能生命周期中的位置、基础证据的强度,以及哪些记录仍存在争议或属临时性。我们还审视了可以从语料库中学到什么。

每条记录都对参与层级、参与者、方法和生命周期阶段进行了编码,将主要分析瓶颈从缺乏参与字段转向公共文档证据质量和存档持久性的不均衡。利用此数据集,我们识别出四个经验模式:集中在少数几个管辖区;社区主导、协同设计和面向治理的参与形式占主导地位;来源领域的长尾分布;以及合作伙伴构成、项目结束时间表和第三方证据核验方面的持续缺口。

本文的贡献有三方面。我们详细说明了一个可重复的协议,用于项目记录的发现、审核和统一,包括去重、地理编码、来源追踪和基于版本发布的存档。然后,我们报告了语料库中的经验模式,强调了地理集中度、参与层级、生命周期节点、组织形式、验证状态和剩余的文档缺口。最后,我们为默认参与式人工智能基础设施提出了一个设计和治理框架。该框架综合了来自公共算法注册中心、集体危机情报试点、原住民数据治理和社区维护的开放科学的经验教训(Carroll 等, 2020 (https://arxiv.org/html/2605.16827#bib.bib23); Kukutai and Taylor, 2016 (https://arxiv.org/html/2605.16827#bib.bib24); Berditchevskaia 等, 2021 (https://arxiv.org/html/2605.16827#bib.bib22); Bowker and Star, 1999 (https://arxiv.org/html/2605.16827#bib.bib32))。该框架不将参与视为添加到技术工作中的可选层,而是将参与视为中介数据收集、模型开发和公共问责的基础设施的默认属性。因此,贡献既是基础设施层面的,也是分析层面的:我们提供了一个可重用、版本化的语料库和地图集,但也利用该语料库来论证当前参与式人工智能可以被比较、质疑和批判性评估的条件。

本文的其余部分安排如下。第 2 节(https://arxiv.org/html/2605.16827#S2)回顾了与参与式人工智能绘制和文档相关的先前工作。第 3 节(https://arxiv.org/html/2605.16827#S3)定义了用于绘制的操作范围。第 4 节(https://arxiv.org/html/2605.16827#S4)介绍了绘制协议和存储库设计。第 5 节(https://arxiv.org/html/2605.16827#S5)报告了语料库层面的模式和文档缺口。第 6 节(https://arxiv.org/html/2605.16827#S6)为默认参与式基础设施提出了治理和设计要求。第 7 节(https://arxiv.org/html/2605.16827#S7)讨论了影响和局限性,随后是结论。

## 2. 背景与相关工作

绘制参与式人工智能借鉴了参与式设计和民主治理的理论,以及记录和比较社会技术系统的实践方法。我们回顾四个领域:(1) 设计与治理中的参与,(2) 人工智能/机器学习中的参与式方法,(3) 文档与评估产物,以及 (4) 公共技术治理中的注册中心、清单与系统映射。

参与式设计源于劳工和工作场所民主化运动,这些运动将技术设计视为权力、协商和情境化专业知识的场所(Schuler and Namioka, 1993 (https://arxiv.org/html/2605.16827#bib.bib4); Simonsen and Robertson, 2012 (https://arxiv.org/html/2605.16827#bib.bib7))。其方法强调情境中的探究、与利益相关者的迭代原型设计,以及对谁的利益被代表给予明确关注。在治理研究中,参与通常通过影响力、代表性和制度形式来评估。Arnstein 的阶梯将象征性的咨询与授权权力区分开来(Arnstein, 1969 (https://arxiv.org/html/2605.16827#bib.bib1)),而 Fung 的类型学则根据谁参与、他们如何商议以及他们拥有何种权力来区分参与形式(Fung, 2006 (https://arxiv.org/html/2605.16827#bib.bib5))。公共行政研究强调了这些机制如何在法律、预算和能力约束下运作,包括当参与被授权但没有相应资源时(Nabatchi, 2012 (https://arxiv.org/html/2605.16827#bib.bib33))。

在人工智能和机器学习领域,参与式方法被认为在整个生命周期都很重要,包括问题制定、数据实践、评估和监控(Birhane 等, 2022 (https://arxiv.org/html/2605.16827#bib.bib9); Sloane 等, 2022 (https://arxiv.org/html/2605.16827#bib.bib8))。一个核心批评是,当社区提供数据或合法性而没有有意义的决策影响力或互惠利益时,“参与”可能变成剥削性劳动或验证表演(Sloane 等, 2022 (https://arxiv.org/html/2605.16827#bib.bib8); Irani, 2019 (https://arxiv.org/html/2605.16827#bib.bib13))。以人为中心的人工智能研究也强调了地方特殊性(local specificity)与规模化压力之间的紧张关系,尤其是对于部署在具有不同规范和制度能力的司法管辖区的系统而言(Selbst 等, 2019 (https://arxiv.org/html/2605.16827#bib.bib14))。与此同时,公共利益技术和设计正义强调参与是重新分配设计权威并使系统目标与社区定义的优先事项相一致的一种策略(Costanza-Chock, 2020 (https://arxiv.org/html/2605.16827#bib.bib11); D’Ignazio and Klein, 2020 (https://arxiv.org/html/2605.16827#bib.bib12))。总之,这些辩论推动了将参与主张与有记录的机制区分开来,并将缺失文档视为经验发现而非麻烦的绘图工作。最近的两项工作为我们的贡献提供了特别直接的背景。Delgado 等人综合了人工智能设计中“参与式转向”的理论基础,并表明当前实践在给予利益相关者的代理权方面差异很大(Delgado 等, 2023 (https://arxiv.org/html/2605.16827#bib.bib42))。我们在定义纳入标准时直接借鉴了这种参与主张与决策影响力之间的区别。Kawakami 等人的“情境化人工智能指南”为围绕拟议的公共部门人工智能系统进行的早期、多利益相关者商议提供了一个协同设计的工具箱(Kawakami 等, 2024 (https://arxiv.org/html/2605.16827#bib.bib43))。该工作是前瞻性和以干预为导向的;相比之下,我们的地图集则记录已有的公共项目,作为可随时间推移进行比较、质疑和重新审视的经验案例库。

文档产物使得不同项目之间的比较成为可能。诸如数据表(datasheets)和模型卡(model cards)等提案标准化了关于数据集/模型、预期用途和性能的报告(Gebru 等, 2021 (https://arxiv.org/html/2605.16827#bib.bib15); Mitchell 等, 2019 (https://arxiv.org/html/2605.16827#bib.bib16));数据陈述(data statements)则规范了自然语言处理中的来源和收集条件(Bender and Friedman, 2018 (https://arxiv.org/html/2605.16827#bib.bib17));算法影响评估和审计框架旨在构建关于风险、缓解措施和监督的披露结构(Reisman 等, 2018 (https://arxiv.org/html/2605.16827#bib.bib19); Raji 等, 2020 (https://arxiv.org/html/2605.16827#bib.bib18))。这些方法为存储库模式设计提供了信息,但通常侧重于技术产物而非参与过程元数据。评估传统增加了相关的区分:价值敏感设计(value sensitive design)将价值视为可以被引出和协商的显式设计约束(Friedman and Hendry, 2019 (https://arxiv.org/html/2605.16827#bib.bib37)),而参与式评估则将参与-作为-数据-收集与对评估问题、解释和使用的共享控制区分开来(Cousins and Whitmore, 1998 (https://arxiv.org/html/2605.16827#bib.bib38))。对于参与式人工智能绘图而言,这表明不仅要记录谁参与了,还要记录参与如何影响了决策以及结果是如何被评估的。

相似文章

民主参与AI资助计划:经验教训和实施方案

OpenAI Blog

OpenAI宣布完成民主参与AI资助计划,从来自113个国家的近1000份申请中选出10个团队,探索AI治理的参与式方法。该计划产生了多样化的项目,包括视频审议、众包审计和代表性保障,OpenAI已发布这些团队的代码和文档。

AI的民主参与

OpenAI Blog

# AI的民主参与 来源:[https://openai.com/index/democratic-inputs-to-ai/](https://openai.com/index/democratic-inputs-to-ai/) AI将产生重大而深远的经济和社会影响。技术塑造个人生活、我们彼此互动的方式,以及整个社会的演进。我们相信,关于AI如何运作的决策应该由反映公共利益的多元观点来引导。法律编码了价值观和规范以规范行为。

推进AI治理发展

OpenAI Blog

OpenAI发布AI治理建议,承诺企业进行内部和外部红队测试以应对安全风险,共享有关新兴能力的信息,以及建立检测AI生成音频和视觉内容的机制。

全球对话的洞察

OpenAI Blog

OpenAI报告了由首席执行官Sam Altman领导的为期四周的全球巡回活动,涵盖6个大陆的25个城市,旨在收集来自用户、开发者和政策制定者的反馈。公司致力于改进产品可访问性、为基础模型制定治理实践,以及通过提高用户素养和支持创作者来释放AI的潜力。