大型科技与企业中的代理AI

Reddit r/AI_Agents 2026/05/23 17:24 新闻

agentic-ai enterprise-ai ai-adoption productivity big-tech compliance development-tools

摘要

一位企业研发经理对大型公司采用AI的现实情况的第一手视角，凸显了高管期望与实际生产力提升之间的差距，以及让团队有效使用AI工具所面临的挑战。

*免责声明——这篇文章是根据我的脑力输入由AI重写的。但我认为它富有启发性且有用。来自一位在大型企业公司管理研发团队的人的第一手经验。如果我的AI需要更新以更简洁地表达，请告诉我 :D* # 一篇长文背景是，我在生命科学领域管理企业软件开发。大约50名工程师分布在多个项目上，为大型公司服务。这些公司员工超过10万，收入数十亿，合规要求无穷无尽，流程层层叠叠，已无人能完全理解。目前这些公司内部正在发生有趣的事情。高层管理分成了两派：一派真正理解AI在做什么，另一派自认为理解AI在做什么。两派看着同样的裁员和生产力报告，得出完全不同的结论。现实是，大多数大型企业在AI出现之前就已经严重超员。太多并行的项目，太多没人愿意碰的遗留软件，整个部门维护着多年前就不再产生有意义收入的系统。所以公司削减开支，释放数百万资金，并将其重新投入AI转型项目。问题在于，许多高管现在认为更小的团队加上AI自动意味着20-30%的生产力提升。而在实践中，当你真正内部评估这些团队时，这些提升通常来自消除协调开销。人少了意味着会议减少、冲突减少、空闲时间减少、审批停滞减少。这种改善即使没有AI也能实现。是的，有些工程师确实变得快了2-3倍。但之后发生了有趣的事情。一旦人们正常完成工作的速度变快，他们就开始做以前因时间不够而忽略的事情：更好的文档、更好的测试、重构、验证、清理。因此整体吞吐量几乎没有变化。仪表盘上下波动几个百分点，领导层就开始从噪声中幻想革命。过去一年里，我一直在帮助团队采用Claude、Codex、Cursor、代理等所有工具。最大的意外是很少有人真正理解这些工具是什么。给普通员工一个Claude就像给小孩一部智能手机——他们按几下按钮，觉得无聊，然后回归基础。把同样的设备交给优秀的创业者或交易员，突然之间整个企业就从无到有。大多数企业AI采用之所以失败，是因为公司从未展示过真实的工作流程。每次AI大会都如出一辙：“生产力在这里提升了”“Claude在那里帮了忙”“Cursor加速了开发”。但没人真正展示如何操作的。没人逐步引导用户看实际例子。员工离开这些会议时心想：“故事不错。但发封邮件就够了。” 最近我向一群商业顾问展示了如何将Claude放到一个包含他们咨询提案的文件夹中，并将其转化为一个多阶段的研究与验证流程。提取主张、研究支持证据、发现矛盾、再运行一次验证、用新发现重建迁移提案。整个过程只用了3个Markdown文件和一条长指令提示。他们震惊了。然后一周后我回访，没人使用。因为需要读的东西太多，设置太复杂。现有的工作流程足够舒适。软件开发就更糟了。一些AI爱好者用Cursor发布了他们的第20个副业项目，现在认为企业工程师是白痴，因为他们无法在两周内交付重要的合规功能。这些人仍然不明白企业开发的时间到底花在哪里。写代码从来不是瓶颈。难点在于架构、稳定的抽象、跨团队对齐、合规、验证、测试、长期可维护性。这才是几个月时间消失的地方。我自己也大力推进代理工作流：BMAD、多代理管道、架构驱动提示等。几周后变得显而易见：即使是最顶尖的模型也经常无法正确遵循企业架构。代码能跑，直到它不行。十次尝试中只有一次产生可靠的东西。另外九次变成了无尽的重新生成循环、部分重写、回滚提交，以及试图说服模型按工程师最初想要的方式思考的提示考古。与此同时，高管们一边焦虑地喝着威士忌，一边要求AI转型，因为他们午餐时间在Lovable上建了个登录页面。任何反对都被解读为抗拒、无能或破坏。高管与工程团队之间的脱节从未如此严重。现在来说不舒服的部分：AI绝对可以将开发速度提升2-10倍。但前提是你接受这个权衡。当前的代理并不能持续产生企业级的可维护系统。因此，充分利用它们的唯一方法是停止将代码质量视为神圣。工程师们讨厌听到这个。但如果你想要最大速度，你就停止手动审查每一行代码，转而围绕验证构建系统：基准测试、测试、子代理审查架构、自动化验证循环。如果代码通过了基准测试且在生产中没有爆炸，管理层通常不会关心它有多优雅。这就是现在真正发生的转变。不是AI取代工程师，而是AI在某些产品类别中取代了对清晰、可读的人类实现细节的需求。问题变成了：你想要快速但有风险，还是慢速但可靠？对于某些产品，速度比可维护性更重要，尤其是在快速验证商业假设时。我会用这种方式构建飞机自动驾驶软件吗？显然不会。构建一个混乱的企业数据聚合平台呢？绝对会。这些系统中的一半即使在完全由人类团队处理时也产生可疑数据。人类花了数十年建造巨大的企业意面工厂，现在却对概率机器能更快生产意面感到震惊。真是一个了不起的物种。还有一件事没人提起：企业AI编码已经非常昂贵。真正的多代理开发工作流每小时轻松消耗20-100美元代币。一旦加入上下文、验证、子代理、SDLC流程和验证循环，每小时1000-4000万代币变得正常。但从经济角度看仍然合理。一名美国软件工程师的完全成本很容易达到每年约20万美元。目前我有一个两人组成的小型AI密集团队，成本大约是： * 工程成本：每月32,000美元 * 代币消耗：每月4,000-5,000美元而他们的工作量大约相当于一个传统五人团队，后者成本接近每月80,000美元。所以是的，节省是真实的。但伴随风险：技术债务、可维护性崩溃，以及未来灾难性重写的可能性。管理层需要有意识地选择这个权衡，而不是假装AI消除了它。

查看原文

大型科技与企业中的代理AI

相似文章

为何如此多的代理型AI项目失败？

企业AI现状

企业如何规模化应用人工智能

工作中“AI 应用”的现实与网络炒作截然不同

企业AI采用中的隐藏缺口：没人搞定如何规模化地管理AI智能体

提交意见反馈