谁已经在部署能做出真实承诺的智能体?
摘要
讨论团队如何处理AI智能体在未经人类批准的情况下做出真实承诺,寻求例外情况及关于责任和法律摩擦的见解。
几天前,我发布了一篇关于团队如何处理AI智能体执行真实行动的权限和授权的帖子。收到了很多回复,这帮助我进行了校准。我不断看到的模式是:对于任何会形成真实承诺的事情,大多数人仍采用人在回路模式。智能体会起草、建议、准备,但在资金流动、合同签署或订单发出之前,需要由人类确认。我想找到例外情况。如果你处于这样一种情况:智能体已经在未经人类逐项批准的情况下做出承诺,无论是在采购、预订、金融交易、B2B谈判还是其他任何智能体的行为会形成真实义务的领域,我很想聊聊你们是如何处理的。我特别感兴趣的是:
* 当出现问题或引发争议时会发生什么?谁承担责任,你们有什么证据表明智能体被授权执行了哪些操作?
* 你们如何向对方传达智能体可以承诺什么、不可以承诺什么?
* 你是否遇到过交易对手因不清楚实际与什么进行交易而提出的法律或采购方面的反对意见?
在这个领域进行构建,试图理解真正的摩擦点在哪里。很乐意分享我在法律方面观察到的情况作为回报。
相似文章
在生产环境中让智能体采取真实操作,你最担心的是什么?
一位开发者分享了在部署能够执行真实操作(如API调用和数据操作)的AI智能体时的担忧,并向社区询问他们的恐惧以及诸如护栏和人工审批等缓解策略。
有人能帮我理解AI Agent的用例或让我信服吗?
一位软件开发者质疑AI Agent的实际价值,表达了对控制权、问责制的担忧,并怀疑手动自动化结合LLM是否比委托给自主代理更可靠。
真有人在实际生产中为客户运行AI代理吗?还是仍是演示品?
一个讨论,质疑AI代理是否真正在生产中用于客户工作,还是主要停留在演示阶段,反映了炒作与现实可靠性之间的差距。
是否有人在生产环境中部署了多智能体AI员工?
关于在生产环境中部署多智能体AI系统的讨论,其中不同的智能体负责规划、执行、沟通和项目管理,询问实际经验与瓶颈。
对于能够执行实际操作的AI代理,你们如何处理权限和授权?
这是一个讨论帖,征求关于如何处理能够执行实际操作的AI代理的权限和授权(包括审计追踪和权限范围)的意见。