production-failures

标签

Cards List
#production-failures

AI agent在身份验证步骤比推理步骤更容易失败。其他人也有发现吗?

Reddit r/artificial · 6小时前

AI agent常常因为身份验证障碍(如电子邮件验证、OTP超时和验证码)而失败,而非推理错误,这凸显了生产环境中的基础设施挑战。

0 人收藏 0 人点赞
#production-failures

我为数十个客户构建了AI代理。以下是大多数在生产中失败的原因(而且不是模型的问题)

Reddit r/artificial · 4天前

一位开发者分享了AI代理在生产中失败的三个常见原因:RAG分块不佳、仅针对演示的提示词、以及缺乏回退逻辑,强调模型质量很少是主要问题。

0 人收藏 0 人点赞
#production-failures

AI代理没有智能问题,它们有状态管理问题

Reddit r/AI_Agents · 2026-05-29

文章认为,AI代理在生产中的大多数故障是由于不稳定的运行状态和内存退化造成的,而非模型能力不足,并强调需要更好的基础设施来支持状态管理、可观测性和自适应可靠性。

0 人收藏 0 人点赞
#production-failures

AI系统常以测试中不显现的方式失败?

Reddit r/AI_Agents · 2026-05-26

讨论AI工作流中干净的基准测试环境与混乱的真实世界使用之间的常见差距,导致生产环境失败,并提及评估平台如Confident AI、Braintrust和Langfuse。

0 人收藏 0 人点赞
#production-failures

我觉得没人讨论大多数AI代理在现实世界中失败的真实原因

Reddit r/artificial · 2026-05-24

文章认为,AI代理在生产环境中失败的主要原因是分发不足、缺乏主动性和持久记忆,而非模型能力限制。

0 人收藏 0 人点赞
#production-failures

@sheriyuo: 今年所有关于“自我进化智能体”的论文都在对文本进行突变:提示词、技能文件、工作流图、记忆模式。MO…

X AI KOLs Timeline · 2026-05-23 缓存

MOSS 为自我进化智能体引入了源代码级重写,能够修复文本层进化无法触及的结构性故障。在 OpenClaw 上,它仅通过一个周期就将四项任务的评分均值从 0.25 提升至 0.61,且无需人工干预。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈