标签
Arize Phoenix 为代码智能体提供本地优先、离线隔离的可观测性,使每个智能体拥有自己的追踪、评估和反馈循环,以实现自我验证。
Arize Phoenix宣布在AI Engineer: Europe会议上举办免费的两小时评估工作坊,由开发者关系主管Laurie Voss主讲,内容包括手动数据检查以及内置与自定义评估。
TanStack AI OpenTelemetry 官方支持现已推出,提供用于追踪、数据集和回放的开源后端,以提升可调试性。
本文讨论了使用 Arize Phoenix 开发 LLM 应用的最佳实践,特别强调了使用训练集/验证集/测试集拆分来进行诚实评估和追踪回归的重要性。