agent-monitoring

标签

Cards List
#agent-monitoring

@rohanpaul_ai: 他们的GitHub有4.2k星 https://github.com/latitude-dev/latitude-llm…

X AI KOLs Following · 昨天 缓存

Latitude是一个开源的人工智能代理监控工具,提供针对基于LLM的代理的问题检测、追踪和评估,类似于Sentry对于AI的作用。

0 人收藏 0 人点赞
#agent-monitoring

@omarsar0: 很高兴看到更多关注智能体可观测性工具。我将Latitude指向我的Claude Code设置,立即就看到了…

X AI KOLs Following · 昨天 缓存

一条关于Latitude的推文,这是一个开源的智能体可观测性工具,可帮助可视化AI智能体的行为和token使用情况,并且能够直接在编辑器中捕获并修复重复出现的故障。

0 人收藏 0 人点赞
#agent-monitoring

使用 Fireworks 构建成本降低 100 倍的轨迹评判器(7 分钟阅读)

TLDR AI · 2026-06-16 缓存

LangChain 和 Fireworks 微调了 Qwen 模型,用于检测代理轨迹中的“感知错误”,实现了 100 倍成本降低,同时保持前沿性能。该评判器模型旨在用错误信号丰富轨迹,以监控代理系统。

0 人收藏 0 人点赞
#agent-monitoring

@LangChain: 追踪你的代理不应是件费力的事。LangSmith Observability 帮助你了解你的代理的表现…

X AI KOLs Following · 2026-06-11 缓存

LangSmith Observability 为 AI 代理提供实时监控,帮助快速识别性能问题。

0 人收藏 0 人点赞
#agent-monitoring

Show HN: 为你的Claude Code代理打造的警察部门

Hacker News Top · 2026-06-11 缓存

agent-pd 是一个开源的日志和监控工具,用于 Claude Code 代理,它记录所有工具和权限事件,并通过确定性检测器重放这些事件以捕获违规行为,而不会阻止任何操作。

0 人收藏 0 人点赞
#agent-monitoring

@vintcessun: 原来agent安全可以不止盯工具调用,还能实时读它的推理过程。Adrian在agent执行动作前,既看行为日志又把reasoning chain过一遍,两个维度交叉检测。效果?DeepMind论文说联合分析比纯行为检查准确率提升35%。它…

X AI KOLs Timeline · 2026-06-10 缓存

Adrian 是一个开源 AI 代理运行时安全监控引擎,通过联合分析代理的行为日志和推理链进行异常检测,比纯行为检查准确率提升 35%,支持 LangChain 两行 SDK 接入。

0 人收藏 0 人点赞
#agent-monitoring

我为我的 Claude Code 子代理建了一个小小的“警察部门”

Reddit r/AI_Agents · 2026-06-09

一个日志钩子和CLI工具,能够将所有来自Claude Code代理及子代理的工具调用和权限事件记录到会话日志中,然后重放日志以审计不当行为,如未经授权的文件读取或权限提升。这是一个只记录不拦截的飞行记录器,而非阻止器。

0 人收藏 0 人点赞
#agent-monitoring

我们如何在规模上实现持续追踪智能(8分钟阅读)

TLDR AI · 2026-06-05 缓存

Braintrust的Topics功能利用LLM摘要,使得生产环境中的代理追踪在大规模聚类和分类中变得可控,该方法受Anthropic的Clio方法启发。

0 人收藏 0 人点赞
#agent-monitoring

Agent-ToM: 通过心智理论推理学习监控自主LLM智能体

arXiv cs.LG · 2026-05-26 缓存

提出 Agent-ToM,一种基于心智理论推理的学习监控框架,通过推断信念和意图来检测自主LLM智能体中的隐蔽恶意行为,性能优于基线监控器。

0 人收藏 0 人点赞
#agent-monitoring

我们捕获了智能体系统中的静默协调失败。接下来该发布什么?

Reddit r/AI_Agents · 2026-05-12

一款旨在检测智能体系统中静默协调失败(如无限循环和流量激增)的开源工具,未来计划推出 FinOps 功能以追踪成本并防止预算超支。

0 人收藏 0 人点赞
#agent-monitoring

[项目更新] Dunetrace:实时监控您的生产环境 AI Agent

Reddit r/AI_Agents · 2026-05-09

Dunetrace 是一款专为生产环境 AI Agent 设计的开源实时监控工具。此次更新增加了跨 Agent 模式分析、与 Langfuse 的深度分析集成,以及对自定义 Agent 的支持。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈