大型科技与企业中的代理AI
摘要
一位企业研发经理对大型公司采用AI的现实情况的第一手视角,凸显了高管期望与实际生产力提升之间的差距,以及让团队有效使用AI工具所面临的挑战。
*免责声明——这篇文章是根据我的脑力输入由AI重写的。但我认为它富有启发性且有用。来自一位在大型企业公司管理研发团队的人的第一手经验。如果我的AI需要更新以更简洁地表达,请告诉我 :D* # 一篇长文 背景是,我在生命科学领域管理企业软件开发。大约50名工程师分布在多个项目上,为大型公司服务。这些公司员工超过10万,收入数十亿,合规要求无穷无尽,流程层层叠叠,已无人能完全理解。 目前这些公司内部正在发生有趣的事情。高层管理分成了两派:一派真正理解AI在做什么,另一派自认为理解AI在做什么。两派看着同样的裁员和生产力报告,得出完全不同的结论。 现实是,大多数大型企业在AI出现之前就已经严重超员。太多并行的项目,太多没人愿意碰的遗留软件,整个部门维护着多年前就不再产生有意义收入的系统。所以公司削减开支,释放数百万资金,并将其重新投入AI转型项目。 问题在于,许多高管现在认为更小的团队加上AI自动意味着20-30%的生产力提升。而在实践中,当你真正内部评估这些团队时,这些提升通常来自消除协调开销。人少了意味着会议减少、冲突减少、空闲时间减少、审批停滞减少。这种改善即使没有AI也能实现。 是的,有些工程师确实变得快了2-3倍。但之后发生了有趣的事情。一旦人们正常完成工作的速度变快,他们就开始做以前因时间不够而忽略的事情:更好的文档、更好的测试、重构、验证、清理。因此整体吞吐量几乎没有变化。仪表盘上下波动几个百分点,领导层就开始从噪声中幻想革命。 过去一年里,我一直在帮助团队采用Claude、Codex、Cursor、代理等所有工具。最大的意外是很少有人真正理解这些工具是什么。给普通员工一个Claude就像给小孩一部智能手机——他们按几下按钮,觉得无聊,然后回归基础。把同样的设备交给优秀的创业者或交易员,突然之间整个企业就从无到有。 大多数企业AI采用之所以失败,是因为公司从未展示过真实的工作流程。每次AI大会都如出一辙:“生产力在这里提升了”“Claude在那里帮了忙”“Cursor加速了开发”。但没人真正展示如何操作的。没人逐步引导用户看实际例子。员工离开这些会议时心想:“故事不错。但发封邮件就够了。” 最近我向一群商业顾问展示了如何将Claude放到一个包含他们咨询提案的文件夹中,并将其转化为一个多阶段的研究与验证流程。提取主张、研究支持证据、发现矛盾、再运行一次验证、用新发现重建迁移提案。整个过程只用了3个Markdown文件和一条长指令提示。他们震惊了。 然后一周后我回访,没人使用。因为需要读的东西太多,设置太复杂。现有的工作流程足够舒适。 软件开发就更糟了。一些AI爱好者用Cursor发布了他们的第20个副业项目,现在认为企业工程师是白痴,因为他们无法在两周内交付重要的合规功能。这些人仍然不明白企业开发的时间到底花在哪里。写代码从来不是瓶颈。难点在于架构、稳定的抽象、跨团队对齐、合规、验证、测试、长期可维护性。这才是几个月时间消失的地方。 我自己也大力推进代理工作流:BMAD、多代理管道、架构驱动提示等。几周后变得显而易见:即使是最顶尖的模型也经常无法正确遵循企业架构。代码能跑,直到它不行。十次尝试中只有一次产生可靠的东西。另外九次变成了无尽的重新生成循环、部分重写、回滚提交,以及试图说服模型按工程师最初想要的方式思考的提示考古。 与此同时,高管们一边焦虑地喝着威士忌,一边要求AI转型,因为他们午餐时间在Lovable上建了个登录页面。任何反对都被解读为抗拒、无能或破坏。高管与工程团队之间的脱节从未如此严重。 现在来说不舒服的部分:AI绝对可以将开发速度提升2-10倍。但前提是你接受这个权衡。当前的代理并不能持续产生企业级的可维护系统。因此,充分利用它们的唯一方法是停止将代码质量视为神圣。工程师们讨厌听到这个。但如果你想要最大速度,你就停止手动审查每一行代码,转而围绕验证构建系统:基准测试、测试、子代理审查架构、自动化验证循环。如果代码通过了基准测试且在生产中没有爆炸,管理层通常不会关心它有多优雅。 这就是现在真正发生的转变。不是AI取代工程师,而是AI在某些产品类别中取代了对清晰、可读的人类实现细节的需求。问题变成了:你想要快速但有风险,还是慢速但可靠?对于某些产品,速度比可维护性更重要,尤其是在快速验证商业假设时。我会用这种方式构建飞机自动驾驶软件吗?显然不会。构建一个混乱的企业数据聚合平台呢?绝对会。这些系统中的一半即使在完全由人类团队处理时也产生可疑数据。 人类花了数十年建造巨大的企业意面工厂,现在却对概率机器能更快生产意面感到震惊。真是一个了不起的物种。 还有一件事没人提起:企业AI编码已经非常昂贵。真正的多代理开发工作流每小时轻松消耗20-100美元代币。一旦加入上下文、验证、子代理、SDLC流程和验证循环,每小时1000-4000万代币变得正常。但从经济角度看仍然合理。一名美国软件工程师的完全成本很容易达到每年约20万美元。目前我有一个两人组成的小型AI密集团队,成本大约是: * 工程成本:每月32,000美元 * 代币消耗:每月4,000-5,000美元 而他们的工作量大约相当于一个传统五人团队,后者成本接近每月80,000美元。所以是的,节省是真实的。但伴随风险:技术债务、可维护性崩溃,以及未来灾难性重写的可能性。管理层需要有意识地选择这个权衡,而不是假装AI消除了它。
相似文章
为何如此多的代理型AI项目失败?
探讨代理型AI项目在企业环境中失败的常见原因,重点分析基础设施、遗留系统、数据碎片化及治理挑战。
企业AI现状
OpenAI发布了2025年企业AI采用报告,显示超过100万商业客户使用OpenAI工具,并呈现显著规模化指标:ChatGPT消息量增长8倍,API推理令牌消耗同比增长320倍。报告强调了可衡量的生产力提升(每天节省40-60分钟)、全球扩张,以及组织中AI领先者与落后者之间日益扩大的差距。
企业如何规模化应用人工智能
本文分享了欧洲企业领袖关于如何有效规模化应用人工智能的见解,强调文化、治理和工作流程重构,而非单纯的工具部署。文章推广了一份执行指南,其中包含实用经验教训以及用于负责任地采用人工智能的领导力诊断工具。
工作中“AI 应用”的现实与网络炒作截然不同
本文指出了社交媒体上关于AI应用的大肆宣传与企业在实际环境中面临的挑战(如数据基础设施薄弱、隐私限制和管理层不切实际的期望)之间的脱节。
企业AI采用中的隐藏缺口:没人搞定如何规模化地管理AI智能体
企业正陷入“第三阶段混乱”:AI智能体泛滥却缺乏治理、归属或审计线索,而可用于生产环境、能当舰队用的管理工具仍缺席。