智能体市场
摘要
讨论了在将AI智能体投入生产时尚未解决的关键问题,并探索了智能体市场的构想——即通过标准化的输入输出和共享评估体系,将离散的工作单元进行交易。
将智能体投入生产时,你遇到的最大未解决问题是什么?我和几位工程师朋友一直在探讨智能体市场的想法。基本上,这是一个用户(以及最终其他智能体)可以从专业智能体那里购买离散工作单元的地方。在我们真正投入时间构建它之前,我们想确认我们认为它能解决的问题是否确实是人们实际遇到的问题。以下是我们一直困扰的问题,加上我们经常从别人那里听到的内容。首先,跨不同供应商或框架组合智能体是一团糟。模式不匹配,错误在不同系统中含义不同,对于子任务成功意味着什么也没有统一的标准。其次,发现机制很粗糙。如果我想要一个真正擅长解析杂乱发票或进行法律红线对比的智能体,我的选择要么是阅读博客文章,要么是直接私信创始人。没有像 npm 或 RapidAPI 这样的平台来用于智能体工作。工具方面有很多,但工作本身却没有。第三,定价模式感觉不对劲。按 token 计费与买家真正关心的东西毫无关系。“审核这份合同”是一个工作单元。“320 万 token”则不是。第四,没有好办法在不付钱的情况下判断智能体 A 是否真的比智能体 B 在特定任务上更好。每个供应商都声称自己很棒,但没有共享的评估标准。我们的假设是,一个将工作作为实际单元(按任务、按结果、按 SLA)出售,并配有共享评估框架和标准化输入输出的市场,能够逐步解决这四大问题。我们希望听听大家对以下问题的看法:这四个问题中哪个最贴近你的实际体验,哪个感觉被夸大了?我们还遗漏了什么?我们感觉智能体之间的编排和状态交接问题可能比我们目前所想的更严重,但不确定。如果你曾尝试在别人的智能体之上进行构建但最终放弃了,是什么时刻让你决定自己动手?欢迎在评论区或私信中深入讨论。
相似文章
AI agents 即将成为软件买家。还有人在思考这个问题吗?
本文讨论了AI agents作为软件购买者的新兴趋势,指出了缺乏针对agent友好的产品评估、定价发现和自主结账的标准化协议。文章提出了三种现有解决方案——llms.txt、MCP servers和agent checkout protocols——并询问公司是否准备好应对非人类流量。
当你为真实服务企业部署AI代理整整一年后,真正出问题的地方是什么
为期一年的反思:为真实服务企业部署AI代理的难点在于,基础设施和边缘情况远比AI层本身更重要。
是否有人在生产环境中部署了多智能体AI员工?
关于在生产环境中部署多智能体AI系统的讨论,其中不同的智能体负责规划、执行、沟通和项目管理,询问实际经验与瓶颈。
我们在构建一个智能体市场,但首先我们搞错了智能体的本质
Boids 团队分享了他们的领悟:构建一个有用的智能体市场,关键在于帮助创作者将他们的专业知识转化为可复用的智能体,而不仅仅是整理和展示已有的智能体。
Cosmic Agent 市场
<p>为你的团队打造的 AI 代理,直接集成进 CMS</p> <p><a href="https://www.producthunt.com/products/cosmic?utm_campaign=producthunt-atom-posts-feed&utm_medium=rss-feed&utm_source=producthunt-atom-posts-feed">讨论</a> | <a href="https://www.producthunt.com/r/p/1127738?app_id=339">链接</a></p>