@ArizePhoenix: 我们一直在尝试并且非常喜欢的一个想法:为每个编码智能体提供自己的可观测性栈。因为Arize ...
摘要
Arize Phoenix 为代码智能体提供本地优先、离线隔离的可观测性,使每个智能体拥有自己的追踪、评估和反馈循环,以实现自我验证。
我们一直在尝试并且非常喜欢的一个想法:为每个编码智能体提供自己的可观测性栈。因为Arize Phoenix可以在你的计算机上完全以本地优先和离线隔离的方式运行,每个编码智能体都可以获得自己的Phoenix实例:自己的端口、自己的SQLite数据库、自己的追踪、自己的评估。这意味着每个在其自己的工作树中工作的智能体都可以观察自己的操作,检查追踪,对其更改运行评估,并利用这个反馈循环在工作交回之前进行自我验证。每个智能体的私有循环:代码 → 追踪 → 评估 → 改进 → 验证。这使得可以在本地扩展许多编码智能体,而不会产生串扰、共享状态或相邻工作之间的干扰。更大的想法是,智能体不应仅仅生成工作。它们应该能够持续地衡量和验证自己的工作。本地优先的可观测性使这变得切实可行。
相似文章
@ArizePhoenix:调试智能体时,必须迅速定位问题!Phoenix 新增对话列表-详情快速导航…
Arize Phoenix 新增对话列表-详情快速导航与可调整抽屉,助力更快调试智能体对话,同时会话已支持 VIM。
@arizeai:.@Chi_Wang_ 在过去几年中不断拓展 Agent 的边界,从 AutoGen 的多智能体愿景到……
Arize AI 将在旧金山举办 Observe 2026 大会,聚焦 AI Agent 及其评估领域,OpenAI、Cursor 和 Uber 的演讲嘉宾将出席。本次大会包含关于多智能体系统及前沿 Agentic AI 的主题演讲。
@bentannyhill: Agent 可观测性是实现目的的手段:让您的 Agent 变得更好。但可观测性和评估工具传统上…
Engine 是一种新工具,它将 Agent 可观测性追踪与自动修复和评估连接起来,为工程团队闭环 Agent 改进流程。
@benhylak:我们构建了第一个本地调试智能体的合理方法。你可以查看你的追踪记录。codex/claude code 也可以。这允许……
一个新的开源工具可以通过查看追踪记录实现AI智能体的本地调试,允许使用codex和Claude code等工具自动编写评估并进行测试。
大多数智能体可观测性感觉像是崩溃录像
作者认为,当前的智能体可观测性提供了行动轨迹,但缺乏运行时对行动为何被允许的合理性说明,这对于涉及金钱、数据或通信的生产部署至关重要。