世界银行:1.5亿至4.3亿人正从事维持AI运转的隐性数据工作
摘要
世界银行的一份报告和纪录片揭示,AI系统依赖于一个由1.5亿至4.3亿低薪数据工作者组成的隐性劳动力,他们通常是全球南方的难民或危机人口,在保密条件下从事剥削性的标注和注释任务。
一部新纪录片跟踪拍摄了为AI标注数据的工作者。世界银行去年的报告统计全球有1.5亿至4.3亿此类工作者,且过去一年人数快速增长。薪酬仍然很低。在数据平台mindrift上,一项任务报酬为0.83美元,每天完成12项任务约9美元,有些人每周工作45到60小时。大部分工作被外包给经济危机国家,或富裕国家的难民,影片研究人员称这绝非偶然。一位社会学家称人工智能“只是一堆劳动汇聚在一起产生结果”,并认为隐藏这种劳动力是蓄意的,是围绕这些系统构建的神话。一位前内容审核员在数月审查谋杀和虐待视频后出现焦虑、抑郁和创伤后应激障碍,至今仍在接受治疗。许多工作者签署保密协议,不得透露其服务的客户:亚马逊、谷歌、OpenAI和Meta。来源:[https://youtu.be/ND7owjmtPNo](https://youtu.be/ND7owjmtPNo)
查看缓存全文
缓存时间: 2026/06/15 08:59
# TL;DR
一部新纪录片揭示,人工智能系统依赖一支隐藏的全球劳动力队伍——人数在1.5亿至4.3亿之间的低收入数据工人,其中许多是难民或身处经济危机国家的人。他们在剥削性的条件下为数据打标签、做标注和审核,而保密协议和企业保密措施使他们的劳动不为人知。
## AI背后的隐藏劳动力
AI常常被描绘成自主、智能且自给自足的。但正如社会学家兼计算机科学家、Vitam研究所数据、算法系统与伦理研究组负责人Milos Micevic所解释的:“当我们谈论AI和所谓的智能自主系统时,我们谈论的是在幕后工作的人。AI不过是一堆劳动、一堆资源、一堆劳动力汇聚在一起产生结果。我认为大多数人不知道这一点——很可能是故意为之。这是为了制造一种叙事,一种围绕这些系统的神话。劳动和资源部分被刻意隐藏起来,不让公众看到。”
## 数据劳动的规模
世界银行去年发布的一份报告估计,全球有1.5亿至4.3亿人从事数据工作——这些人生成、标注或处理AI系统学习所需的数据。这一数字在过去一年中呈指数级增长。国际劳工组织(ILO)高级经济学家Othmane Rani指出:“是时候退一步思考,这些系统在多大程度上是AI,在多大程度上是人类参与。AI背后有很多隐形的人类工人在做数据工作,将数据输入系统,以便算法能够进一步发展,模型能够正常运行。”
## 数据工作的具体内容
数据工作有多种形式。29岁的Anab Tas来自印度加尔各答,目前正在攻读硕士学位,他为一家做图像和文本标注的公司工作。“目前我在做图像分类,”他说。“我们会收到图像和选项——活跃火灾、烟雾、有雾或清晰。如果一栋建筑在燃烧,我就将其分类为活跃火灾。然后处理下一张。”他还对图像中的点进行标注——水、道路、树木——以便自动驾驶汽车等系统能够识别物体。“目的是确保自动驾驶汽车能够检测到周围的一切。数据工人基本上在标注什么是汽车、什么是浴室、什么是自行车、人行道是什么样子、灌木是什么,这样汽车就能轻松识别它们。”
这项工作是不间断的,因为模型是在特定时刻构建的,但世界每天都在变化。“你必须不断向系统输入信息,”Tas解释道。“AI需要数据来构建模型。”
## 定向外包与剥削
绝大多数数据工作被外包到全球南方。研究员Milos Micevic表示:“这不是随机的。很可能是设计好的。这些平台和业务流程外包公司倾向于瞄准那些经济危机严重、工资低的国家。为什么这只发生在全球南方?因为机构薄弱、失业率高、工人愿意接受任何条件、许多地方的劳动权利根本不存在。或者也许全球北方也有,但从事的不是本国公民——而是难民或移民。他们瞄准的是绝望的群体。”工资从来不足以让工人摆脱贫困。“他们给的工资只够让工人今天勉强过活,但明天呢?你永远不知道。”
纪录片中的一个案例显示,芬兰的女性囚犯每项任务赚取3欧元,入狱两个月后总共赚了462欧元。该公司的AI工具用于建筑行业。
在Mindrift平台上,一项任务报酬为0.83美元。工人每天收到12项任务,收入约9美元。有些人每周工作45到60小时。一位名叫Anna的乌克兰难民,2022年带着女儿搬到保加利亚,她说:“我不能透露我的收入。我的薪水是保密的。我不能谈论这件事。这不容易,因为我有个孩子。我的薪水常常不够,所以我必须找另一份工作。我现在有两份工作,只是为了能生活,而不是仅仅生存。”
## 人力成本:心理健康与保密
情感上的代价是严重的。Fenn Makila从事AI内容审核工作超过三年,他说:“一开始并不难,但随着时间的推移,我发现自己经常做噩梦,尤其是在审核了涉及未成年人或儿童的谋杀或强奸案件之后。如果白天看到很多尸体,晚上就睡不着。我产生了焦虑。我无法出门,无法去人多的地方。我感觉自己不再是自己了。我曾经是个外向的人,但现在我独自待着。这导致了抑郁,所以我决定辞职。如今,创伤后应激障碍的痕迹仍在。我仍然在接受治疗。我的同事也遭受同样的症状——失眠、焦虑和不同程度的创伤后应激障碍。”
工人们签署了严格的保密协议,禁止他们透露所服务的客户。“他们让我们签署了一份保密协议,限制我能说什么,”一位工人说。“一旦我说出来,他们就会传播开来,我可能会被监禁超过10年。”纪录片指出,像亚马逊、谷歌、OpenAI和Meta这样的科技巨头是最终客户。
其中一个特别恶劣的案例涉及肯尼亚的工人。“我们审核的有毒内容中,至少90%来自OpenAI。发送的数据集几乎100%是有毒的,实际上是99.99%。这完全令人不安且极其有毒。”纪录片认为,这是有意设计的:AI系统需要学习正常内容和极端内容,因此公司将最令人毛骨悚然的工作外包给最廉价的劳动力市场。
## 结论:自主的神话
纪录片总结道,AI背后的隐藏劳动力不是副作用,而是刻意的策略。通过让工人隐形,科技公司维持了AI自主、智能且无人力成本的神话。正如Milos Micevic所说:“隐藏劳动力是非常刻意的——这是围绕这些系统制造神话的一部分。”讽刺的是,AI看起来越“智能”,它实际上需要的隐形人力工作就越多。
来源:https://youtu.be/ND7owjmtPNo
相似文章
🤖 人工智能行业利用数百万低薪员工
这篇文章揭露了发展中国家数百万低薪工人在剥削条件下为AI模型执行关键的数据标注和内容审核工作,而科技公司为了维持全自动化的假象,刻意掩盖了这种人类劳动的存在。
AI数据中心繁荣的隐性成本
在美洲信息系统会议上发表的一项学术研究,描绘了AI数据中心繁荣带来的五大系统性矛盾,包括能源悖论、水资源压力、超大规模运营商主导、主权侵蚀和城市迁移,凸显了日益增长的环境和社会成本。
揭秘驱动ChatGPT的AI血汗工厂
一项调查揭示了为ChatGPT标注数据的隐藏劳动力所面临的不稳定工作条件,其中近五分之一曾经历过无家可归,突显了由大型科技公司推动的新型零工经济。
[OC] 我利用国际劳工组织数据绘制了中国3.62亿劳动者的人工智能暴露图谱,最大的风险并不在大多数人预想的地方
一项基于国际劳工组织数据的分析绘制了中国3.62亿劳动者的人工智能暴露情况,结果显示办公室文员面临的风险最高(8.5/10),而手工艺工人尽管人数最多,暴露程度却很低(2.5/10)。
微软报告揭示了人工智能的真实成本问题:使用该技术比雇佣人类员工更昂贵
微软和其他科技公司在发现人工智能的计算成本超过人类劳动力成本后,正在缩减AI工具的使用,这凸显了人工智能应用中的一个主要经济瓶颈。