我的AI代理在同一QA任务上反复失败10多次。如何修复工作流？

Reddit r/AI_Agents 2026/06/12 18:24 新闻

ai-agents qa-automation workflow-optimization claude-code hermes web-testing reliability

摘要

用户报告在使用AI代理（Hermes + Claude Code）对Web应用进行探索性QA时反复失败，原因包括数据库错误、缓存过时和基础设施调试。他们寻求关于创建可靠工作流的建议，包括预检查、清除缓存和限制代理范围。

我让我的AI代理（Hermes + Claude Code）对我的Web应用进行深度探索性QA，涵盖4个角色、每个功能、记录错误。每次运行都以不同的方式失败：数据库错误、Vite缓存过时、引导覆盖层阻挡导航、代理花费20次调用调试基础设施而不是进行测试。我修复代理工具链的时间比获得QA结果的时间还多。如何设计一个可靠的QA代理工作流？先进行服务器健康检查？每次运行之间清除缓存？禁止基础设施调试？还是说这根本不适合代理，我应该回到人工测试？

查看原文

我的AI代理在同一QA任务上反复失败10多次。如何修复工作流？

相似文章

我一直放弃多智能体工作流，因为我无法验证它们提交的代码。你们是怎么处理的？

如何提高AI代理的可靠性？

你究竟如何调试AI代理？

智能体跟进与验证问题

AI代理构建者：生产中什么最常出问题？

提交意见反馈