无人提及的AI部署漏斗:60%评估,20%试点,5%上线。MIT追踪了300个真实AI实施的盈利指标。

Reddit r/artificial 新闻

摘要

MIT研究人员追踪了300个真实AI实施案例,发现仅5%的评估最终进入全面生产部署,95%的AI投资未产生可衡量的成果。成功部署聚焦于边界明确的任务,并设有定义明确的成功指标。

2025年底,MIT研究人员衡量了行业一直回避直接面对的问题——不是预测或试点数字,而是300个真实企业AI部署的可记录成果,并对照盈利指标进行追踪。部署漏斗如下:60%的公司评估了AI工具,其中20%进行了试点,而这些试点中仅有5%达到了服务线的全面生产部署。95%的AI投资在产生可衡量成果之前就消散了。那些成功进入生产阶段的公司有明显模式:它们不要求AI替代判断,而是识别出边界明确的任务——特定输入、定义输出、可控的故障模式。它们在部署前而非部署后衡量成功标准。例如内容起草、代码审查、大规模数据摘要。而那95%未能成功的公司则存在:仓促行事、未定义成功指标、以及假设工具上线后效率提升会自然显现。研究中有一句话值得深思:'我们用AI取代了X名员工'并不是效率指标,而是人员数量指标——两者不是一回事。Klarna已经进入反转阶段,在AI效率数字未能在大规模下维持后重新招聘人类员工。在你还能及时调整方向之前,你发现的最清晰的信号是什么,来判断一个部署是否真正奏效?
查看原文

相似文章

为什么80%的智能体AI演示无法投入生产

Reddit r/AI_Agents

本文解释了为什么80%的智能体AI演示因幻觉、工具使用错误累积、边缘情况、成本、延迟和可观测性问题而无法进入生产环境。文章强调了成功的关键:窄范围、可验证输出、人工检查点、真实可观测性、基于置信度的门控以及简单架构。

当前AI最大的瓶颈在于部署层的模型迭代

Reddit r/artificial

文章指出,当前生产环境中AI的最大瓶颈并非初始模型部署,而是持续的迭代周期——将生产使用(推理日志、用户反馈)转化为用于微调和重新部署的数据集。文章强调了构建集成反馈循环而非一次性项目的重要性。