observability

标签

Cards List
#observability

同一模型,不同框架:性能波动高达30-50个百分点。但团队依然仅凭模型名称来挑选智能体。

Reddit r/AI_Agents · 3小时前

文章指出,智能体框架对性能的影响(30-50个百分点的波动)远大于模型选择本身,认为团队应关注实例级别的验证,而不仅仅盯着模型名称。

0 人收藏 0 人点赞
#observability

@BraceSproul:Fleet 代理中的可配置追踪 现在你可以在 Fleet 中按代理级别启用或禁用追踪!这是一个重大…

X AI KOLs Following · 昨天 缓存

Fleet 代理现在支持按代理进行可配置追踪,允许开发者启用或禁用详细的追踪信息,以便更好地进行调试。

0 人收藏 0 人点赞
#observability

@svpino:当今最被低估的技能:可观测性。我觉得仅凭这一技能,你就能构建职业生涯,并拥有20年的稳定收入——如果你学得好的话,下面我来告诉你原因。

X AI KOLs Following · 昨天 缓存

这是一篇关于Honeycomb Innovation Week 2026的推广文章,该活动是一个为期3天的免费线上活动(5月12-14日),聚焦代理时代的可观测性,包含主题演讲、产品发布和合作内容。

0 人收藏 0 人点赞
#observability

@ArizePhoenix:TanStack AI Otel 官方支持现已推出!正在寻找用于追踪、数据集和回放的开源后端?来看看我们的…

X AI KOLs Following · 昨天 缓存

TanStack AI OpenTelemetry 官方支持现已推出,提供用于追踪、数据集和回放的开源后端,以提升可调试性。

0 人收藏 0 人点赞
#observability

一行系统提示修改将模型质量从84%降至52%。人们在生产环境中如何监控语义质量?

Reddit r/AI_Agents · 昨天

一位开发者分享了他们的经历:一个系统提示的修改导致LLM回答质量下降,却没有触发传统的监控告警,并介绍了他们为监控生产环境中LLM应用的语义质量而构建的内部工具。

0 人收藏 0 人点赞
#observability

@knoYee_: https://x.com/knoYee_/status/2052626513888203131

X AI KOLs Timeline · 昨天 缓存

This article introduces 7 production-ready skills from the Hermes Skills Hub, covering the full lifecycle from tool integration and structured output to deployment, observability, and security.

0 人收藏 0 人点赞
#observability

@techNmak: 这可能是目前网上最坦诚的AI架构解析。九层AI生产架构…

X AI KOLs Timeline · 昨天

一份关于九层生产AI架构的详细解析,涵盖RAG管道、代理、提示词、安全、评估和可观测性层。

0 人收藏 0 人点赞
#observability

@ArizePhoenix:谁来评判评估者?当你使用LLM作为评判者时,你正在信任一个模型来决定你的代理、工作流……

X AI KOLs Following · 昨天

本文讨论了使用Arize Phoenix调试和评估LLM评判者所面临的挑战,Arize Phoenix通过OpenTelemetry追踪评估者运行过程,以检查决策逻辑、成本和潜在偏差。

0 人收藏 0 人点赞
#observability

Tracea

Product Hunt · 2026-04-29

Tracea 是一款新产品,为AI代理提供类似Datadog的可观测性,具备追踪、根本原因分析和团队记忆等功能。

0 人收藏 0 人点赞
#observability

遥测驱动开发

Lobsters Hottest · 2026-04-22 缓存

Smart Rent 的 Noah 为 Elixir 提出「遥测驱动开发」:先用 OpenTelemetry 埋点,再上线,用 84.8 万台 Nerves 网关的真实数据取代拍脑袋。

0 人收藏 0 人点赞
#observability

@pauliusztin_:每天都有100+人问我“怎么学AI评估?”我每次都把11个链接直接粘贴:1. AI评估与可观测(系列)

X AI KOLs Timeline · 2026-04-21

一份每日被反复转发的11个精选链接,帮你掌握AI评估技术,涵盖评估方法、可观测性、LLM-as-judge与智能体评估。

0 人收藏 0 人点赞
#observability

在OpenTelemetry中通过回溯采样优化尾部采样

Hacker News Top · 2026-04-18 缓存

VictoriaMetrics在KubeCon EU 2026上介绍了回溯采样,这一新方法与传统OpenTelemetry尾部采样相比,显著降低了流量、CPU和内存开销。

0 人收藏 0 人点赞
#observability

Datadog 使用 Codex 进行系统级代码审查

OpenAI Blog · 2026-01-09 缓存

Datadog 将 OpenAI 的 Codex 集成到其代码审查流程中,发现它能检测出人类审查员遗漏的 22% 的历史事件,展现出相比传统静态分析工具更强的系统级推理能力。

0 人收藏 0 人点赞
#observability

@whitecircle:我们融资1100万美元,助你掌控AI

X AI KOLs Timeline · 2026-04-21 缓存

White Circle 完成1100万美元融资,推出统一AI管控平台,为企业部署提供红队测试、护栏、可观测性与优化。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈