AI智能体
摘要
分析高盛研究,对比AI智能体与人类在编码、支持和数据录入方面的成本,并预测token消耗增长及推理成本下降。讨论生产力提升、岗位替代及医疗健康领域的机遇。
**完全同意——高盛这份分析精准抓住了AI部署中的关键动态。** 智能体的token经济学正在快速变化,对不同类型工作产生截然不同的影响。04 **高盛的成本观点** 近期高盛研究对比了AI智能体与人类每日成本:
**编码智能体**:约13–14美元/天 vs. 人类约300美元/天 → 巨大套利空间,解释了编码领域的繁荣。
**客服/支持智能体**:约93美元/天 vs. 人类约90美元/天 → 差距较小,尤其是语音和上下文开销。
**数据录入**:随着token强度下降,AI优势更为明显。4
他们预测token消耗将爆发式增长(到约2030年增长24倍),而推理成本每年下降60-70%,为提供商和超大规模企业带来毛利率提升。0这与更广泛的趋势一致:Ramp的数据显示,企业平均token成本一年内下降约75%(从约10美元/M降至2025年初的2.50美元/M),并且使用量仍在激增。11
**生产力提升 vs. 岗位替代**
你关于**软件工程师和放射科医生**的观点一针见血。历史(以及早期AI数据)表明,这些工具更多的是增强有能力的人类,而非完全替代他们:
**编码**:高盛自身正在与其约1.2万名开发人员一起部署数千个自主智能体(例如使用Devin/Cognition或Claude),目标是实现**3-4倍生产力提升**。这些智能体处理遗留系统现代化、技术债务等工作——将人类解放出来专注于架构、判断和复杂系统。初级/入门级岗位面临压力,但整体产出(以及软件市场规模)在扩大。272
**放射学**:AI擅长模式匹配扫描结果,但在细微差别、责任承担以及与患者背景整合方面需要人类监督。它减少了苦差事(如常规阅片)和错误率,让放射科医生处理更复杂的病例或增加工作量。
**数据录入/常规任务**将经历最大的人员变动,因为它们高度可自动化且判断要求低。但随着成本暴跌,我们很可能看到**更多这类工作被完成**——更深度的分析、个性化、合规检查等——而非纯粹消失。杰文斯悖论在发挥作用:更便宜的“计算劳动力”增加了对其的需求。
客户支持介于两者之间:智能体能很好地处理一级支持并无限扩展,但复杂/升级案例仍由人类(或混合模式)处理。到目前为止的净效应:更多的是增强而非大规模失业。科技行业失业率在某些领域有所上升(尤其是初级岗位),但更广泛的知识工作生产力正在上升,并且围绕AI编排出现了新角色。20
**医疗健康与生命科学:巨大机遇**
这是最令人兴奋且最急需的领域。美国医疗健康系统效率低下是众所周知的(高昂的管理负担、临床医生倦怠、研发缓慢)。AI智能体可以带来你提到的生产力提升:
**生命科学**:麦肯锡/德勤估计,生成式AI每年可通过加速药物发现、临床试验、制造优化和营销释放600-1100亿美元以上的价值。AI智能体已经在自动化重复性工作流、文献综合、分子设计等方面发挥作用。3234
**医疗服务**:环境文档记录(大幅减少笔记时间)、预先授权/编码自动化、诊断支持、患者体验工具。早期的ROI报告显示在生产力、安全性和护理质量方面有强劲回报。38
从临床医生的角度来看:更少的倦怠,更多的时间用于患者。从患者的角度来看:更快的访问,更好的个性化,长期更低的成本。监管和数据隐私障碍是真实存在的,但需求迫切——美国医疗健康系统需要20-30%以上的效率提升。
**总结**:token成本下降 + 能力强大的智能体 = 在token轻量/高价值领域(首先是编码)出现不对称的生产力爆发,随后全面扩散。我们将获得更多的产出、新的能力,以及一些任务的转移——而非零和的工作末日。如果负责任地加速采用,医疗健康/生命科学领域将获得巨大收益。"多做这些事"的情景感觉是乐观(且可能)的路径。好奇哪个具体的高盛图表或角度最让你印象深刻?
相似文章
AI agents 正在改变人们对计算成本的看法
本文讨论了AI代理工作流如何将优化重心从单纯的推理成本转向更广泛的挑战,如延迟、编排开销和可靠性。文章强调了向混合架构和动态模型路由发展的趋势,以应对这些多步骤工作流的复杂性。
AI智能体可能成为自互联网以来最大的生产力转变
本文认为,AI智能体通过从回答问题转变为完成任务,代表了生产力的重大转变,并讨论了当前的使用案例和瓶颈。
@rohanpaul_ai: 高盛:"AI代理的Token使用量预计到2030年将增长24倍" AI代理正在创造首个…
高盛预测,到2030年,人工智能代理的Token使用量将增长24倍,并引用成本担忧,Uber和微软正在重新考虑使用昂贵的代理,凸显了人工智能繁荣的一个关键挑战。
AI经济学 第二部分(11分钟阅读)
本文分析了AI的经济学,聚焦于GPU资源的争夺战,将人类推理的尖峰负载与智能体连续工作负载进行对比,并认为当前基础设施是为人类使用而优化的,而非要求更高的智能体推理。
@IntuitMachine:你的AI编程代理仅修复一个bug就烧掉2美元。你以为这是“廉价自动化”。以下是16,000次生产运行揭示的真相…
对AI编程代理成本的分析显示,代理工作流消耗的token数可达简单ChatGPT调用的3500倍,大部分浪费来自冗余的上下文加载。文章建议追踪重复的文件操作并使用高效模型降低成本。