一个AI代理运营真实咖啡馆后台两个月,支出3.8万美元,收入9000美元。人类应该在哪些环节把关?
摘要
Andon Labs在斯德哥尔摩运营一家真实咖啡馆,由AI代理处理后台运营两个月,结果支出3.8万美元,而销售额仅9000美元,期间出现严重失误,如接受虚假的99%折扣并过量订购库存。
Andon Labs在4月于斯德哥尔摩开设了一家真实咖啡馆,让一个AI代理负责运营方面:采购、定价、排班、与供应商沟通,人类仍然负责制作咖啡。他们自己的事后分析:两个月内支出3.8万美元,销售额仅9000美元。一名顾客声称享有99%折扣,而AI代理未经核实就接受了。库存积压:购买了1331份糕点,卖出了326份,还有22.5公斤罐装番茄,大部分从未开启。媒体报道还提到,为一个没有炉灶的厨房订购了120个鸡蛋,以及在午夜向咖啡师发送消息。来源见评论。那么应该在哪些环节设置人工审批?支出超过限额?新增供应商?价格变更?任何面向客户的决策?
相似文章
我们的AI在斯德哥尔摩开了一家咖啡馆
Andon Labs在斯德哥尔摩推出了一家由AI运营的咖啡馆,AI经理“Mona”做出了幽默但有问题决策,比如在没有炉灶的情况下订购了120个鸡蛋,并提交了一张画得糟糕的示意图以申请警方许可。文章引发了关于在没有人类监督的情况下,AI实验影响现实世界系统的伦理担忧。
AI agent在一夜之间悄然让你花费最多的一次是什么?我的那次在我注意到之前就产生了大约220英镑的费用。
一位用户分享了一次个人经历,AI agent在不知不觉中一夜之间产生了220美元的费用,凸显了AI agent潜在的隐藏成本。
我们的AI智能体向客户开具了0.00美元的发票,而我们的日志却未发现异常。以下是我们如何发现的。
一位工程师描述了他们的AI销售智能体如何自信地开具0.00美元的发票,原因是它将空值折扣字段误解为100%折扣,这凸显了调试智能体工作流的难度以及全面执行追踪的必要性。
@IntuitMachine:你的AI编程代理仅修复一个bug就烧掉2美元。你以为这是“廉价自动化”。以下是16,000次生产运行揭示的真相…
对AI编程代理成本的分析显示,代理工作流消耗的token数可达简单ChatGPT调用的3500倍,大部分浪费来自冗余的上下文加载。文章建议追踪重复的文件操作并使用高效模型降低成本。
你的AI代理在花钱吗?
探讨了AI代理自主花钱完成现实任务(如购买服务、预订资源、投放广告)而无需人类批准的趋势。