agent-monitoring

#agent-monitoring

@rohanpaul_ai: 他们的GitHub有4.2k星 https://github.com/latitude-dev/latitude-llm…

X AI KOLs Following ↗ · 昨天缓存

Latitude是一个开源的人工智能代理监控工具，提供针对基于LLM的代理的问题检测、追踪和评估，类似于Sentry对于AI的作用。

0 人收藏 0 人点赞

#agent-monitoring

@omarsar0: 很高兴看到更多关注智能体可观测性工具。我将Latitude指向我的Claude Code设置，立即就看到了…

X AI KOLs Following ↗ · 昨天缓存

一条关于Latitude的推文，这是一个开源的智能体可观测性工具，可帮助可视化AI智能体的行为和token使用情况，并且能够直接在编辑器中捕获并修复重复出现的故障。

0 人收藏 0 人点赞

#agent-monitoring

使用 Fireworks 构建成本降低 100 倍的轨迹评判器（7 分钟阅读）

TLDR AI ↗ · 2026-06-16 缓存

LangChain 和 Fireworks 微调了 Qwen 模型，用于检测代理轨迹中的“感知错误”，实现了 100 倍成本降低，同时保持前沿性能。该评判器模型旨在用错误信号丰富轨迹，以监控代理系统。

0 人收藏 0 人点赞

#agent-monitoring

@LangChain: 追踪你的代理不应是件费力的事。LangSmith Observability 帮助你了解你的代理的表现…

X AI KOLs Following ↗ · 2026-06-11 缓存

LangSmith Observability 为 AI 代理提供实时监控，帮助快速识别性能问题。

0 人收藏 0 人点赞

#agent-monitoring

Show HN: 为你的Claude Code代理打造的警察部门

Hacker News Top ↗ · 2026-06-11 缓存

agent-pd 是一个开源的日志和监控工具，用于 Claude Code 代理，它记录所有工具和权限事件，并通过确定性检测器重放这些事件以捕获违规行为，而不会阻止任何操作。

0 人收藏 0 人点赞

#agent-monitoring

@vintcessun: 原来agent安全可以不止盯工具调用，还能实时读它的推理过程。Adrian在agent执行动作前，既看行为日志又把reasoning chain过一遍，两个维度交叉检测。效果？DeepMind论文说联合分析比纯行为检查准确率提升35%。它…

X AI KOLs Timeline ↗ · 2026-06-10 缓存

Adrian 是一个开源 AI 代理运行时安全监控引擎，通过联合分析代理的行为日志和推理链进行异常检测，比纯行为检查准确率提升 35%，支持 LangChain 两行 SDK 接入。

0 人收藏 0 人点赞

#agent-monitoring

我为我的 Claude Code 子代理建了一个小小的“警察部门”

Reddit r/AI_Agents ↗ · 2026-06-09

一个日志钩子和CLI工具，能够将所有来自Claude Code代理及子代理的工具调用和权限事件记录到会话日志中，然后重放日志以审计不当行为，如未经授权的文件读取或权限提升。这是一个只记录不拦截的飞行记录器，而非阻止器。

0 人收藏 0 人点赞

#agent-monitoring

我们如何在规模上实现持续追踪智能（8分钟阅读）

TLDR AI ↗ · 2026-06-05 缓存

Braintrust的Topics功能利用LLM摘要，使得生产环境中的代理追踪在大规模聚类和分类中变得可控，该方法受Anthropic的Clio方法启发。

0 人收藏 0 人点赞

#agent-monitoring

Agent-ToM: 通过心智理论推理学习监控自主LLM智能体

arXiv cs.LG ↗ · 2026-05-26 缓存

提出 Agent-ToM，一种基于心智理论推理的学习监控框架，通过推断信念和意图来检测自主LLM智能体中的隐蔽恶意行为，性能优于基线监控器。

0 人收藏 0 人点赞

#agent-monitoring

我们捕获了智能体系统中的静默协调失败。接下来该发布什么？

Reddit r/AI_Agents ↗ · 2026-05-12

一款旨在检测智能体系统中静默协调失败（如无限循环和流量激增）的开源工具，未来计划推出 FinOps 功能以追踪成本并防止预算超支。

0 人收藏 0 人点赞

#agent-monitoring

[项目更新] Dunetrace：实时监控您的生产环境 AI Agent

Reddit r/AI_Agents ↗ · 2026-05-09

Dunetrace 是一款专为生产环境 AI Agent 设计的开源实时监控工具。此次更新增加了跨 Agent 模式分析、与 Langfuse 的深度分析集成，以及对自定义 Agent 的支持。

0 人收藏 0 人点赞

agent-monitoring

提交意见反馈