标签
Dunetrace 是一款专为生产环境 AI Agent 设计的开源实时监控工具。此次更新增加了跨 Agent 模式分析、与 Langfuse 的深度分析集成,以及对自定义 Agent 的支持。
文章指出,智能体框架对性能的影响(30-50个百分点的波动)远大于模型选择本身,认为团队应关注实例级别的验证,而不仅仅盯着模型名称。
Fleet 代理现在支持按代理进行可配置追踪,允许开发者启用或禁用详细的追踪信息,以便更好地进行调试。
这是一篇关于Honeycomb Innovation Week 2026的推广文章,该活动是一个为期3天的免费线上活动(5月12-14日),聚焦代理时代的可观测性,包含主题演讲、产品发布和合作内容。
TanStack AI OpenTelemetry 官方支持现已推出,提供用于追踪、数据集和回放的开源后端,以提升可调试性。
一位开发者分享了他们的经历:一个系统提示的修改导致LLM回答质量下降,却没有触发传统的监控告警,并介绍了他们为监控生产环境中LLM应用的语义质量而构建的内部工具。
This article introduces 7 production-ready skills from the Hermes Skills Hub, covering the full lifecycle from tool integration and structured output to deployment, observability, and security.
一份关于九层生产AI架构的详细解析,涵盖RAG管道、代理、提示词、安全、评估和可观测性层。
本文讨论了使用Arize Phoenix调试和评估LLM评判者所面临的挑战,Arize Phoenix通过OpenTelemetry追踪评估者运行过程,以检查决策逻辑、成本和潜在偏差。
Smart Rent 的 Noah 为 Elixir 提出「遥测驱动开发」:先用 OpenTelemetry 埋点,再上线,用 84.8 万台 Nerves 网关的真实数据取代拍脑袋。
一份每日被反复转发的11个精选链接,帮你掌握AI评估技术,涵盖评估方法、可观测性、LLM-as-judge与智能体评估。
VictoriaMetrics在KubeCon EU 2026上介绍了回溯采样,这一新方法与传统OpenTelemetry尾部采样相比,显著降低了流量、CPU和内存开销。
Datadog 将 OpenAI 的 Codex 集成到其代码审查流程中,发现它能检测出人类审查员遗漏的 22% 的历史事件,展现出相比传统静态分析工具更强的系统级推理能力。
White Circle 完成1100万美元融资,推出统一AI管控平台,为企业部署提供红队测试、护栏、可观测性与优化。