@AnthropicAI:AI对经济的影响最终将体现在就业和生产力等综合数据上,但首先会从AI应用最密集的领域显现出来。
摘要
Anthropic经济指数报告通过追踪Claude的使用情况,按小时和日度层面反映经济模式,揭示工作节奏、产出类型以及用户对AI在就业和生产力方面影响的预期。
查看缓存全文
缓存时间: 2026/06/26 16:11
AI对经济的影响最终会体现在就业和生产力等宏观数据上,但最初会在AI承担最多工作的地方显现出来。通过追踪使用模式如何每小时、每个界面的变化,我们可以在这些变化发生时实时观察到它们。
Anthropic经济指数报告:节律
来源:https://www.anthropic.com/research/economic-index-june-2026-report
引言
一年前,大多数Claude的使用形式是用户与助手之间的对话。随着Claude Code和Cowork的快速增长,Claude会话现在越来越多地由长时间运行的代理任务组成。聊天记录已不再能完全反映人们如何使用AI,我们研究Claude经济影响的方法也必须随之调整。
为了跟上步伐,我们对经济指数的数据管道进行了几项更改。在此版本中,我们:
- 以更高的频率采样数据,使我们能够观察到小时级别的使用模式。
- 引入新的分类器,标记每次对话的输出。
- 分享更细粒度的数据,按月度汇总,分别列出聊天和Cowork对话(统称“Claude对话”)以及1P API的结果。¹
我们在附录(https://cdn.sanity.io/files/4zrzovbb/website/03ed1410f74a65ae4cc2a27120d0875e1e569535.pdf)中描述了其他方法变化。这些变化共同提供了更清晰的图景,展示AI如何反映并渗透到经济生活中。
此外,我们此前缺乏对Claude在用户会话之外影响的可见性。人们如何看待AI改变他们的工作或可用的机会?他们对AI的使用是否塑造了他们的期望?在理想情况下,他们希望从AI那里得到什么?我们报告了2026年4月启动的Anthropic经济指数调查(https://www.anthropic.com/research/economic-index-survey-announcement)的初步发现。
以下是我们主要发现的预览。
-
在第1章中,我们展示了外部世界的节奏如何影响Claude的使用。工作相关查询在周末减少,但在最高薪职业中幅度较小;人们倾向于在早上询问新闻,而睡眠建议在凌晨5点左右达到高峰;税务相关请求在申报截止日期前后激增。
-
第2章探讨了人们从Claude会话中获得的具体输出。这些输出高度依赖于他们使用的产品。例如,聊天和Cowork提供比Claude Code更多的解释。输出的性质也塑造了人们与Claude的互动。构建网站比翻译文档留给Claude更多的判断空间,后者的答案主要由文本决定。我们还发现,更多的计算资源与更有价值的工件相关联;某个输出消耗的令牌数随其预估工作价值而上升。
-
第3章展示了Anthropic经济指数调查的初步结果,我们通过隐私保护系统(https://www.anthropic.com/research/clio)将其与Claude使用数据关联起来。期望和体验随人们使用Claude的方式而系统性地变化:以最自动化方式使用Claude的人预计AI将在未来一年承担更多他们的任务,但同时对其工作前景感到最乐观,预期对薪酬、工作保障和意义产生积极影响。
我们新的隐私保护遥测技术每天持续采样一部分对话,使我们能够研究每日和每小时的模式,而此前每期经济指数报告依赖于7天样本。这些分析捕捉了全球工作模式的潮起潮落。²
我们发现Claude使用反映了工作周,个人提示在周末激增。每小时数据捕捉了日内模式——人们最常在凌晨5点左右寻求睡眠建议,晚上6点左右询问食谱。我们还看到使用模式反映了关键日期。例如,税务相关请求在4月15日美国申报截止日期前激增。
工作周
在样本期间,聊天和Cowork³对话中被归类为个人使用的比例从工作日的约35%激增至周末的近50%(图1.1)。在工作周之外,用户的对话从商务通信、营销文案和幻灯片转向情感支持、医疗问题和投资建议。这种转变在高收入国家最为显著。
图1.1:个人对话在周末增加每日个人使用对话在Claude.ai(http://claude.ai/)、Claude Desktop、Claude Code和1P API中的占比。周六和周日以灰色阴影表示。
Claude Code和1P API流量(即直接通过Anthropic路由的API流量)也呈现类似模式,但两者的个人使用基线较低。⁴
请求集群⁵使我们能够深入一层,看到哪些特定的Claude Code任务在周末和工作日之间波动最大。在周末,下降最多的Claude Code使用集群包括后端架构、API调试和数据存储。增加最多的包括AI代理设计、量化交易和游戏。
周末也可能为人们追求新事业创造了空间。在各个国家,与创业相关的对话在周六和周日最高。然而,求职申请活动在周末与其他工作相关任务一起下降。⁶
日常节奏
每小时中,Claude使用反映了日常生活的节奏。图1.2显示了不同请求集群的每小时频率相对于其在全球流量中总体平均值的变化。⁷
人们在当地时间上午7点询问新闻。商务通信(例如邮件起草)勾勒出工作日的轨迹,在上午10-11点略有峰值。最大的峰值之一是食谱请求,晚上6点的频率是平均水平的2.3倍。媒体推荐最集中在晚上,而人们在黎明前的几个小时内寻求睡眠建议。
图1.2:一天中的请求集群不同请求集群中对话的标准化每小时占比,仅限Claude聊天和Cowork数据。
在夜间和周末,当人们确实为工作使用Claude时,任务偏向于较高薪职业(图1.3)。虽然我们无法确定性地识别发出这些请求的人的职业,但这可能反映了高薪职业(如营销经理或计算机程序员)的人更可能在传统时间之外工作。相比之下,与最低两个四分位职业(如电话营销和文书工作)相关的任务在总对话中的占比下降。这种模式并非仅由计算机和数学任务驱动:在稳健性检验中移除这些职业后,高四分位任务在夜间和周末仍然增加。
图1.3:夜间和周末工作相关对话占比的变化,按职业薪酬四分位分类每个柱状图显示了指定薪酬四分位的任务在夜间和周末相对于工作日工作时间的占比百分比变化。薪酬四分位使用BLS数据计算,并按转录本数量加权。
纳税日
本报告样本期涵盖美国个人纳税申报截止日期。图1.4显示了截止日期前后税务相关对话占比的大幅飙升。4月14日,税务相关集群的出现频率是5月平均日的8倍,并在4月15日保持同样高水平。4月16日,它们急剧下降。
图1.4:税务相关对话在美国申报截止日期前激增美国及世界其他地区税务相关对话的占比。
工件
在本章中,我们按工件对聊天和Cowork(以下简称“Claude对话”)⁸中的每次对话进行分类,并将其分为30多个类别。我们将Claude在对话中产生的主要输出——文档、解释、一段代码、学术论文等,无论是在聊天窗口中呈现还是作为单独文档——称为工件。工件完整列表见附录(https://cdn.sanity.io/files/4zrzovbb/website/03ed1410f74a65ae4cc2a27120d0875e1e569535.pdf)。
我们的分类器识别出93%的Claude对话产生了工件(图2.1)。⁹最常见的工件是解释(占对话的17%)、文档和报告(15%)以及指导(11%)。对话式输出(如解释或指导)和书面交付物(如文档或演示文稿)各占约三分之一的对话;代码和技术工作(如应用或脚本)约占六分之一。
图2.1:Claude的输出具有特定输出的对话占比。图中展示了Claude对话中最常见的十二种输出类型。1P API的分布见附录。
输出是什么并不能说明它的用途:同一个工件可能是工作交付物或个人项目。我们接下来看一下这种划分。
每个工件用于什么?
我们1月的经济指数(https://www.anthropic.com/research/anthropic-economic-index-january-2026-report)引入了一种原始分类,将每次对话分为工作、个人或课程作业。在这里,我们将这种划分应用于Claude对话中产生的工件(图2.2)。
某些类别的工件几乎总是个人用途。超过80%的产生创意写作、指导和食谱的对话被归类为个人用途。在同一类别内,个人和工作用途可能看起来非常不同。例如,个人创意写作以粉丝小说、世界构建和诗歌为主;13%的工作相关创意写作主要是短视频脚本、剧本和演讲稿。最可能属于工作用途的类别包括创建营销内容(80%)、创建博客或文章(81%)以及编写数据库查询(82%)。
许多输出同样可能用于个人和工作原因,包括创建计划或策略(44%工作相关,49%个人)或翻译(42%工作,44%个人)。例如,最常见的个人计划工件包括旅行行程和锻炼计划,而工作计划大多涉及创业或内容策略。
最后,课程作业特有的工件包括创建学术论文和学位论文、教育材料和数学相关查询,尽管每个类别中都有不可忽视的部分同时属于工作和个人类别。
图2.2:按用例划分的工件占比按用途(工作、个人和课程作业)分类的具有特定输出的对话占比。
我们也可以反过来提问。不是问每个输出用于什么,而是问工作、个人和课程作业对话各自倾向于产生什么样的工件。工作对话最常产生文档和报告(20%),其次是解释(9%)、邮件草稿(7%)以及分析和总结(6%)。课程作业对话看起来大致相似,文档和报告也居首(21%),紧随其后的是解释(20%)、教育材料(11%)和学术论文(6%)。相比之下——毫不意外——只有6%的个人对话产生文档。相反,最常见的结果是解释(25%)和推荐(22%)。
成本随工作价值变化
产生这些输出需要计算资源,我们发现计算资源往往随工作价值而扩展。我们以令牌(即处理和生成的文本量,包括Claude的内部推理)来衡量每次对话的计算成本,并通过将每次对话的分类任务映射到通常执行该任务的职业来进行跨职业比较。在本节中,我们将分析限制在工作相关对话。
图2.3的左面板显示了对话级别的中位数令牌数与映射职业的中位数工资之间的正相关关系。¹⁰例如,营销经理的薪酬大约是编辑的两倍(每小时80美元对37美元),映射到他们任务的对话消耗的令牌数大约是后者的2.5倍。诚然,这种关系存在噪声,且存在显著异常值。例如,药剂师的薪酬几乎是统计助理的三倍(每小时68美元对24美元),但映射到药剂师任务的对话消耗的令牌数仅有后者的约二十分之一。
图2.3:高薪职业的对话消耗更多令牌左面板:特定职业的中位数工资与归类为该职业任务的对话中典型的(几何平均)令牌数之间的关系,已按总体平均值归一化。两个变量均以对数尺度表示。右面板:生成给定工件所使用的令牌分布。黑线表示中位数,箱体表示第25和第75百分位数,须线表示第10和第90百分位数。所有数字均按总体中位数令牌数归一化,并以对数尺度显示。两个面板的数据均限于聊天和Cowork,且限于归类为工作相关的对话。令牌计数未根据服务对话的模型进行调整。
生成不同类型工件所消耗的令牌数也讲述了类似的故事。更复杂和更有价值的输出往往消耗显著多于简单输出的令牌。例如,关于构建应用的对话消耗的令牌数是中位数对话的三倍以上。在光谱的另一端,一个典型的解释消耗的令牌数约为中位数对话的五分之一。约44%的令牌消耗工资梯度可由输出组合解释——高薪职业更可能产生计算密集型工件。
为什么这在经济上重要?在映射到高薪职业的对话中,Claude每轮产生更多输出(1.34倍),用户参与更多轮次(1.53倍),并且更频繁地启用扩展思考(34%的对话对31%;表2.4)。关键是,这些因素共同作用:Claude产生更多并不意味着用户贡献更少。如果人在最高价值任务中仍然保持参与,这种模式看起来更像是劳动增强而非劳动替代。它还表明,在某种程度上,更有价值的输出成本更高。下一节将考察每段对话中有多少决策被委托给Claude。
表2.4:高薪职业中更高令牌消耗的原因映射到高薪职业的对话中导致更高令牌消耗的对话特征。职业按其中位数工资分为三组,并按匹配到每个职业的对话数量加权。计算相关指标已按最低组的几何平均值归一化。例如,第一行显示映射到最高组职业的典型对话消耗的令牌数是映射到最低组职业的典型对话的2.07倍。
Claude在多大程度上拥有自主决策权?
我们按1-5级衡量,从“无”到“极高”。易于描述或指定的任务涉及很少的自主权:自主权最低的输出是数学或计算、翻译和问答。高自主权任务是那些需要s
相似文章
@AnthropicAI:要真正理解AI的经济影响,我们需要收集更多此类定性数据。因此我们……
Anthropic推出月度Claude用户调研,收集AI如何改变工作的定性数据,以更好理解AI的经济影响。
2026年4月22日 经济研究 81,000人告诉我们的人工智能经济学
Anthropic发布了一项针对81,000名Claude用户的调查结果,显示高AI暴露度的劳动者既报告了显著的生产力提升,也增加了对失业风险的担忧。该研究将这些主观的经济恐惧与特定职业中AI使用情况的量化数据进行了关联分析。
2026年4月22日经济研究Anthropic经济指数调查发布
Anthropic推出了Anthropic经济指数调查,这是一项月度计划,通过Anthropic Interviewer从Claude用户处收集关于AI对其工作、生产力和未来预期影响的定性数据。
经济研究
Anthropic 的经济研究团队发布经济指数及相关研究,以追踪全球 AI 采用情况、生产力影响和劳动力市场变化。
2026年6月26日经济研究Anthropic经济指数报告:节奏
Anthropic的2026年6月经济指数报告分析了Claude在小时和日级别的使用模式,将AI采用与经济节奏联系起来,并引入了关于用户期望的调查数据。