@dabit3: 现在智能体可以行动了,我们需要问:它们何时运行,可以接触什么,工作如何被检查,以及它们获得什么上下文……
摘要
作者提出将自动化工程作为一门学科,用于设计触发器、护栏和成功检查,使AI智能体能够安全可靠地运行,无需持续的人类监督。
查看缓存全文
缓存时间: 2026/06/28 09:59
既然智能体能够行动了,我们不禁要问:它们何时运行?能触碰什么?工作如何被检查?获得怎样的上下文?这就是自动化工程,不过对象是 AI 智能体而非工厂车间。
软件工程:将需求转化为可靠的系统。
自动化工程:设计触发器、护栏和成功检查,让云智能体安全地完成有用工作,无需人工启动、引导或监视。
自动化工程应属于智能体工具链的一部分,与我们已使用的模型、工具、集成、评估和部署系统并列。
这是我们在 @cognition 的重中之重和发展领域。 https://docs.devin.ai/product-guides/automations…
示例——死代码自动化(提示方向由 @lukerramsden 提供)
相似文章
有人能帮我理解AI Agent的用例或让我信服吗?
一位软件开发者质疑AI Agent的实际价值,表达了对控制权、问责制的担忧,并怀疑手动自动化结合LLM是否比委托给自主代理更可靠。
有没有人也觉得AI代理在事情变得复杂之前都表现得很惊艳?
对AI代理令人印象深刻的演示和可靠的实际执行之间差距的反思,认为当前代理擅长结构化任务但在不可预测条件下会失败,并指出近期AI角色将主要集中于带人类监督的窄范围自动化。
代理规则必须存在于操作发生的地方
本文主张,人工智能代理的安全规则应作为硬性工作流约束和权限来实现,而非仅依赖提示词指令。文章强调对于敏感或不可逆的操作,需要明确的检查、审批和日志记录。
Agent工程中的枯燥部分
作者讨论了在生产中构建可靠AI Agent时那些不引人注目但至关重要的方面,包括监控运行中的进程、恢复失败的任务以及提供UI状态,并向社区询问常见的痛点和现成的解决方案。
AI代理的工具调用是否应在执行前进行检查?
讨论AI代理的工具调用是否应在执行前进行检查,探讨安全性和验证方面的考虑。