@rauchg:代理是特别难以调试的软件。首先,由于设计,AI模型的行为是非确定性的。Eve…

X AI KOLs Following 工具

摘要

Vercel推出了Eve,这是一个内置可观测性、调试、持久执行和沙箱计算的代理框架,旨在简化生产环境中的代理开发。

代理是特别难以调试的软件。 首先,由于设计原因,AI模型的行为是非确定性的。即使两个完全相同的提示也不总是产生相同的输出。 但代理也是复杂的分布式系统。它们涉及跨函数和沙箱的多步计算,触及数十个可能宕机、限流等的API服务。 在Vercel上为http://eve.dev实现开箱即用的可观测性是团队的一个关键优先事项,到目前为止的反馈是↓
查看原文
查看缓存全文

缓存时间: 2026/06/27 20:01

智能体软件尤其难以调试。

一方面,AI模型本身具有非确定性行为——即便两次完全相同的提示词,也可能产生不同的输出。但智能体同时也是复杂的分布式系统:它们涉及跨函数和沙箱的多步计算,触及数十个可能宕机、限流等问题的API服务。

http://eve.dev 在 Vercel 平台上实现开箱即用的可观测性,是团队的核心优先事项。截至目前,用户反馈如下 ↓


eve – 智能体框架 - Vercel

来源:https://vercel.com/eve

构建智能体的框架

如同适用于 Web 应用的 Next.js,但专为智能体设计。指令和技能采用 Markdown,工具使用 TypeScript。默认具有持久性。

一个智能体 = 一个目录

用 Markdown 定义指令和技能,用 TypeScript 定义工具,然后部署。框架会编译该目录,关联持久化工作流,并连接渠道。

充分利用 Vercel 所有 AI 原语

AI Gateway 管理模型调用,Sandboxes 提供沙箱,Workflows 实现工作流,Connect 负责连接。所有关键的智能体基础设施开箱即用,无需再拼凑各种碎片化方案。

生产级智能体所需的一切

企业级治理、可观测性和沙箱化计算环境均包含在内。专注构建,无需操心基础设施。

  • 持久化执行:工作流可抵御崩溃和重启,每一步都会设置检查点。智能体在等待时会自动暂停,收到下一条消息后恢复执行。
  • 沙箱化计算:智能体按需启动隔离的虚拟机。文件系统访问、bash 执行、代码运行,完全隔离。
  • 多渠道交付:同一套智能体代码库可部署到网页聊天、Slack、API、定时任务、命令行以及自定义应用。
  • 人工介入流程:需要确认的工具会触发审批关卡。会话在解决前暂停,之后无缝恢复。
  • 子智能体:将专业任务委派给具有独立提示词、工具和沙箱的子智能体。
  • 评估:通过评分规则定义测试套件。每次部署和按计划运行评估。

立即构建你的第一个智能体

Vercel 开发者(@vercel_dev): 现在你可以使用 Vercel Observability 追踪和调试 eve 智能体运行。

在同一个页面检查模型和工具调用、运行时错误以及令牌用量。

相似文章

EVE-Agent: 可验证证据的自我进化智能体

arXiv cs.AI

EVE-Agent 提出了一个自我进化搜索智能体框架,通过生成问题、答案和证据片段,并基于证据的边际准确性增益进行训练,确保证据可验证性。这提高了基于依据的正确性,且无需人工标注。