2026年6月26日经济研究Anthropic经济指数报告:节奏

Anthropic Research 新闻

摘要

Anthropic的2026年6月经济指数报告分析了Claude在小时和日级别的使用模式,将AI采用与经济节奏联系起来,并引入了关于用户期望的调查数据。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/06/26 17:20

# Anthropic Economic Index 报告:节奏 来源: https://www.anthropic.com/research/economic-index-june-2026-report ## **引言** 一年前,Claude 的主要使用形式还是用户与助手之间的对话。随着 Claude Code 与 Cowork 的迅速发展,现在 Claude 会话越来越多地表现为长期运行的自主任务。聊天记录已无法完整体现人们如何使用 AI,我们研究 Claude 经济影响的方法也必须随之调整。 为跟上这一变化,我们对经济指数的数据管道进行了几项调整。在本版本中,我们: - 以更高的频率采样数据,使我们能够观察到逐小时的使用模式。 - 引入新的分类器,用于标记每次对话的输出。 - 分享更细粒度的数据,将聊天和 Cowork 对话(合称为“Claude 对话”)以及 1P API 的结果按月聚合后单独列出。¹ 我们在附录(https://cdn.sanity.io/files/4zrzovbb/website/03ed1410f74a65ae4cc2a27120d0875e1e569535.pdf)中描述了其他方法上的变化。这些调整共同为我们提供了更清晰的图景,展现 AI 如何映射并渗透到经济生活中。 此外,此前我们一直无法了解 Claude 在*用户会话之外*的影响。人们如何看待 AI 正在改变他们的工作或他们可获得的机会?他们对 AI 的使用是否塑造了他们的预期?在理想情况下,他们希望 AI 能做些什么?我们在此报告 Anthropic 于 2026 年 4 月启动的Anthropic 经济指数调查 (https://www.anthropic.com/research/economic-index-survey-announcement)的初步结果。 以下是我们的主要发现预览。 - 在第一章中,我们展示了外部世界的节奏如何塑造 Claude 的使用。与工作相关的查询在周末会减少,但在最高薪职业中这一变化不那么显著;人们倾向于在早上询问新闻,而睡眠建议在凌晨 5 点左右达到高峰;与税务相关的请求在申报截止日期附近激增。 - 第二章探讨了人们从 Claude 会话中获得的具体输出结果。这些结果高度依赖于用户所使用的产品。例如,聊天和 Cowork 提供的解释比 Claude Code 更多。输出的性质也塑造了人们与 Claude 的交互方式。构建网站比翻译文档(其答案主要由文本决定)要给 Claude 留下更多判断空间。我们还看到,更多的计算资源与更有价值的产出相关联;某个输出消耗的 token 数量随其工作的估计价值增加而增加。 - 第三章展示了 Anthropic 经济指数调查的初步结果,我们通过我们的隐私保护系统 (https://www.anthropic.com/research/clio)将其与 Claude 使用数据关联起来。预期和体验随人们使用 Claude 的方式而系统性地变化:以最自动化方式使用 Claude 的人预期 AI 将在未来一年承担他们更多的任务,但同时也对这对他们工作的意义感到最为乐观,预计将对薪酬、工作安全感和工作意义产生积极影响。 ## 第一章:节奏 我们新的隐私保护遥测技术会每天持续抽样一部分对话,这使得我们能够研究日常和逐小时的使用模式,而之前的每一期经济指数报告都依赖于七天的样本。²这些分析捕捉到了全球范围内工作模式的起伏。 我们发现 Claude 的使用反映了工作周的模式,个人提示词在周末激增。逐小时数据捕捉到了一天之内的模式——人们最常在凌晨 5 点左右询问睡眠建议,在下午 6 点左右询问食谱。我们还看到使用量反映了关键日期。例如,在美国 4 月 15 日申报截止日期前,与税务相关的请求激增。 ### 工作周 在抽样期间,被归类为个人使用的聊天和 Cowork³对话比例从工作日的约 35% 上升至周末的近 50%(图 1.1)。在工作时间之外,用户的对话从商务信函、营销文案和幻灯片转向情感支持、医疗问题和投资建议。这一转变在高收入国家最为明显。 ***图 1.1:个人对话在周末增加****在Claude.ai (http://claude.ai/)、Claude Desktop、Claude Code 和 1P API 上,个人使用对话的每日占比。周六和周日以灰色阴影标出。* 在 Claude Code 和 1P API 流量(即直接通过 Anthropic 路由的 API 流量)中也存在类似模式,尽管两者的个人使用基线率较低。⁴ 请求集群⁵使我们能够再深入一层,查看哪些具体的 Claude Code 任务在工作日和周末之间波动最大。在周末,Claude Code 使用集群中下降最多的包括后端架构、API 调试和数据存储。上升最多的包括 AI 智能体设计、量化交易和游戏。 周末也可能为人们追求新事业创造了空间。在各个国家,与创业相关的对话在周六和周日最高。然而,求职活动在周末会与其他工作相关任务一同下降。⁶ ### 每日节奏 逐小时来看,Claude 的使用反映了日常生活的节奏。图 1.2 显示了不同请求集群的每小时频率相对于其在全球流量中整体平均值的差异。⁷ 人们会在当地时间早上 7 点询问新闻。商务信函(例如邮件起草)追踪着工作日的轨迹,在上午 10–11 点略有峰值。最大的峰值之一是食谱请求,其在下午 6 点的频率是平均水平的 2.3 倍。媒体推荐最集中在晚间,而人们在黎明前几个小时寻求睡眠建议。 ***图 1.2:一天中的请求集群****属于不同请求集群的对话的归一化每小时占比,仅限于 Claude 聊天和 Cowork 数据。* 在夜间和周末,当人们确实转向 Claude 处理工作时,这些任务往往偏向于高薪职业(图 1.3)。虽然我们无法确定性地识别这些请求背后人的职业,但这可能反映了高薪职业人群(如营销经理或计算机程序员)更可能在传统工作时间之外工作。相比之下,与收入最低两个四分位数的职业相关的任务(如电话推销和文书工作)在总对话中的占比下降。这一模式并非仅由计算机和数学任务驱动:在进行稳健性检验时,我们移除了这些职业,较高四分位数的任务在夜间和周末仍然增加。 ***图 1.3:夜间和周末期间工作相关对话占比的变化,按职业工资四分位数划分****每个柱形表示来自指定工资四分位数的工作相关任务在夜间和周末相比于工作日工作时间的百分比变化。工资四分位数根据 BLS 数据计算,并按转录本数量加权。* ### 纳税日 本报告涵盖的抽样期间包含了美国人的税务申报截止日期。图 1.4 显示,在截止日期前后,与税务相关的对话占比出现了大幅激增。4 月 14 日,税务相关集群的出现频率是 5 月平均日的八倍,并且在 4 月 15 日仍然保持同等高水平。到 4 月 16 日,这一比例急剧下降。 ***图 1.4:税务相关对话在美国报税截止日期前激增****美国和世界其他地区与税务相关的对话占比。* ## 第二章:产出 在本章中,我们根据产出对聊天和 Cowork(以下称为“Claude 对话”)⁸中的每次对话进行分类,并将其归入 30 多个类别。我们将 Claude 在对话中产生的主要输出——无论是呈现在聊天窗口中还是作为独立文档——称为产出(artifact),包括文档、解释、一段代码、学术论文等。完整的产出列表见附录(https://cdn.sanity.io/files/4zrzovbb/website/03ed1410f74a65ae4cc2a27120d0875e1e569535.pdf)。 我们的分类器识别出 93% 的 Claude 对话产生了某种产出(图 2.1)。⁹最常见的产出是解释(占对话的 17%)、文档和报告(15%)以及指导(11%)。对话式产出(如解释或指导)和书面交付成果(如文档或演示文稿)各占约三分之一的对话;代码和技术性工作(如应用程序或脚本)约占六分之一。 ***图 2.1:Claude 的输出****具有特定输出的对话占比。图中显示了 Claude 对话中最常见的十二种输出类型。1P API 的分布见附录。* 输出的类型并不能告诉你它的用途:同一个产出既可能是工作交付物,也可能是个人项目。接下来我们将探讨这一划分。 ### 每种产出的用途是什么? 我们的一月经济指数 (https://www.anthropic.com/research/anthropic-economic-index-january-2026-report)引入了一个原语,将每次对话分类为工作、个人或课程作业。在此,我们将这一划分应用于 Claude 对话中产生的产出(图 2.2)。 某些类别的产出几乎总是个人性质的。超过 80% 产生创意写作、指导和食谱的对话被归类为个人用途。在各个类别内部,个人用途和工作用途可能看起来大不相同。例如,个人创意写作以同人小说、世界构建和诗歌为主;而 13% 的工作相关创意写作主要以短视频脚本、电影剧本和演讲稿的形式出现。最可能是工作相关的类别包括创建营销内容(80%)、创建博客或文章(81%)以及编写数据库查询(82%)。 许多产出同样可能用于个人和工作原因,包括创建计划或策略(44% 工作相关,49% 个人)或翻译(42% 工作,44% 个人)。例如,最常见的个人计划产出类型包括旅行行程和锻炼计划,而工作计划最常涉及创业或内容策略。 最后,课程作业特有的产出包括创建学术论文和学位论文、教育材料以及与数学相关的查询,尽管这些类别中也有不可忽视的部分同时属于工作和个人范畴。 ***图 2.2:按用例划分的产出占比****以特定输出为结果的对话占比,按其目的分类为工作、个人和课程作业。* 我们也可以反过来问这个问题。与其问每个输出的用途,不如问工作、个人和课程作业对话各自倾向于产生什么类型的产出。工作对话最常产生文档和报告(20%),其次是解释(9%)、邮件草稿(7%)以及分析和总结(6%)。课程作业对话大体相似,也是文档和报告占主导(21%),紧随其后的是解释(20%)、教育材料(11%)和学术论文(6%)。相比之下——毫不意外的是——只有 6% 的个人对话会产出文档。相反,最常见的结果是解释(25%)和推荐(22%)。 ### 成本与工作价值挂钩 产生这些输出需要计算资源,我们发现计算资源往往随工作价值的增加而增加。我们以 token(即处理并生成的文本量,包括 Claude 的内部推理)来衡量每次对话的计算成本,并通过将每次对话的分类任务映射到通常执行该任务的职业来跨职业进行比较。在本节中,我们仅分析工作相关的对话。 图 2.3 的左图显示了对话级别的 token 数量中位数与映射职业的工资中位数之间的正相关关系。¹⁰例如,营销经理的收入大约是编辑的两倍(每小时 80 美元 vs. 37 美元),而映射到营销经理任务的对话消耗的 token 数量大约是编辑任务的 2.5 倍。诚然,这种关系存在噪音,并且存在显著的异常值。例如,药剂师的收入几乎是统计助理的三倍(每小时 68 美元 vs. 24 美元),但映射到药剂师任务的对话使用的 token 数量仅为统计助理的二十分之一左右。 ***图 2.3:高薪职业的对话消耗更多 token****左图:给定职业的中位工资与归类为该职业某一任务的对话中典型(几何平均)token 数量之间的关系,已按总体平均值进行归一化处理。两个变量均以对数尺度表示。右图:生成给定产出所使用的 token 数量分布。黑线表示中位数,箱体表示 p25 和 p75,须线表示 p10 和 p90。所有数字均按整体 token 数量中位数进行归一化,并以对数尺度呈现。两图中的数据均仅限于聊天和 Cowork,且仅包含被归类为工作相关的对话。Token 数量未根据服务对话的模型进行调整。* 生成不同类型产出所消耗的 token 数量讲述了一个类似的故事。更复杂和更有价值的输出消耗的 token 数量通常显著多于更简单的输出。例如,关于构建应用程序的对话消耗的 token 数量是普通对话的三倍以上。而在另一个极端,一次典型的解释所消耗的 token 数量仅为普通对话的五分之一左右。大约 44% 的工资梯度在 token 消耗上是由输出组合解释的——高薪职业更可能产生计算密集型产出。 为什么这在经济上重要?在映射到高薪职业的对话中,Claude 产生更多内容(每轮输出量增加 1.34 倍),而用户参与更多(轮次增加 1.53 倍),并且更频繁地启用扩展思考(34% 的对话对比 31%;表 2.4)。关键在于,这些因素共同作用:Claude 产生更多并不意味着用户减少参与。如果人类仍然参与最高价值的任务,那么这种模式更像是劳动增强而非劳动替代。这也表明,在某种程度上,更有价值的产出成本更高。下一节将探讨每个对话中委托给 Claude 的决策程度。 ***表 2.4:高薪职业中 token 消耗更高的原因****在高薪职业对话中导致 token 消耗增加的特征。按中位工资将职业分为三组,并按匹配到每个职业的对话数量加权。与计算相关的度量值已按最低组的几何平均值进行归一化。例如,第一行显示,映射到最高组职业的典型对话消耗的 token 数量是映射到最低组职业的典型对话的 2.07 倍。* ### Claude 拥有多大的自主决策权? 我们按 1-5 级进行衡量,从“无”到“极高”。容易描述或指定的任务涉及很少的自主权:自主权最低的输出是数学或计算、翻译以及问答。高自主权任务是需要从许多可能的选项中做出选择的任务,例如创建应用程序和网站、游戏或演示文稿。这类需要持续判断的工作历来难以自动化。通过比较 Claude 聊天和 Cowork 与 Claude Code 的自主权水平,我们展示了这一点。

相似文章

2026年4月22日 经济研究 81,000人告诉我们的人工智能经济学

Anthropic Research

Anthropic发布了一项针对81,000名Claude用户的调查结果,显示高AI暴露度的劳动者既报告了显著的生产力提升,也增加了对失业风险的担忧。该研究将这些主观的经济恐惧与特定职业中AI使用情况的量化数据进行了关联分析。

经济研究

Anthropic Research

Anthropic 的经济研究团队发布经济指数及相关研究,以追踪全球 AI 采用情况、生产力影响和劳动力市场变化。