AI agents初体验令人惊艳,但工作流一乱就麻烦不断

Reddit r/AI_Agents 新闻

摘要

对AI agents的反思:在狭窄的监督任务中令人印象深刻,但由于会话过期、上下文漂移和静默失败等问题,在长期运行、混乱的工作流程中显得脆弱且不可靠。

我最近经常玩AI agents,老实说,同样的事情一直在发生。一开始感觉太神奇了。你连接几个工具,突然间:研究自动化了,报告生成了,重复性任务消失了,以前需要几个小时的工作流程现在几分钟就完成。那一瞬间真的感觉‘好吧,这改变了一切’。然后真正使用开始了。会话过期。上下文漂移。一个奇怪的API响应破坏了链条。有时agent说任务完成了,但一半的工作流已经静默失败。最让我惊讶的是,最困难的部分通常甚至不再是模型本身。而是可靠性。目前,AI agents在狭窄的监督工作流中表现出色,但一旦事情变得长期且混乱,它们仍然相当脆弱。
查看原文

相似文章