monitoring

标签

Cards List
#monitoring

贵公司使用哪个平台满足AI代理的可观测性和可靠性需求?

Reddit r/AI_Agents · 2小时前

一位构建多代理金融工作流的开发者寻求社区关于生产环境中AI代理可观测性和可靠性工具的建议,分享了对碎片化现状和级联故障的困扰。

0 人收藏 0 人点赞
#monitoring

Zen Reports

Product Hunt · 16小时前

Zen Reports 是一款产品,允许网站所有者追踪和分析源自 ChatGPT 的流量。

0 人收藏 0 人点赞
#monitoring

@NFTCPS: Hermes 这波直接把 Agent 天花板给掀了! 全网程序员已经开始用它搭桌面神器、跑创意流水线、省 token 省到飞起——你还没跟上? 先说 hermes-desktop,CLI 小玩具直接进化成 Mac/Windows 原生桌面…

X AI KOLs Timeline · 16小时前 缓存

本文介绍了围绕Hermes Agent构建的五个开源工具项目,包括桌面应用、创意工作流、共享记忆层、token压缩工具和监控仪表板,旨在扩展Agent的生态系统。

0 人收藏 0 人点赞
#monitoring

TigrimOSR v0.4.1:在远程服务器上无头运行AI代理,由快速的本地Rust UI控制

Reddit r/AI_Agents · 昨天

TigrimOSR v0.4.1 是一个 Rust 原生工具,它允许在远程服务器上无头运行 AI 代理,同时通过快速的本地桌面 UI 进行控制,支持远程缓存和多代理工作流。

0 人收藏 0 人点赞
#monitoring

我们开始衡量智能体工作流中的“未声明意图开销”

Reddit r/AI_Agents · 2天前

本文探讨了在智能体工作流中衡量“未声明意图开销”的方法,通过量化超出声明意图范围的计算Token消耗,揭示诸如行为漂移与偏离任务执行等行为成本。

0 人收藏 0 人点赞
#monitoring

xyOps

Product Hunt · 3天前

xyOps 是一款开源运维自动化工具,具备工作流管理和监控功能。

0 人收藏 0 人点赞
#monitoring

@LangChain:部署前进行评估,部署后进行监控,利用所学经验优化下一版本

X AI KOLs Following · 4天前 缓存

LangChain 强调在部署前对 AI 应用进行评估,并在部署后持续监控,以不断提升模型性能。

0 人收藏 0 人点赞
#monitoring

@OpenAI: 我们也有三家第三方AI安全组织对我们的分析提供了反馈:@redwood_ai, @apolloaievals, @M…

X AI KOLs · 4天前 缓存

OpenAI在强化学习训练中意外允许评分人员看到思考链;Redwood Research审阅其分析后发现,证据在很大程度上消除了对危险影响的担忧,但仍存在轻微风险。

0 人收藏 0 人点赞
#monitoring

你究竟如何调试AI代理?

Reddit r/AI_Agents · 5天前

开发者分享了在生产环境中调试AI代理的困境,指出了幻觉问题、提示词更改导致的回归以及高昂的API成本,并向社区征求策略。

0 人收藏 0 人点赞
#monitoring

@PrajwalTomar_: 老铁,这种事我见过太多次了。有人构建了 AI agent,部署上线,感觉自己是个天才。3 天后它却……

X AI KOLs Following · 5天前

该帖强调了监控已部署 AI agent 的重要性,以防止造成高昂成本的无限循环和意外支出。

0 人收藏 0 人点赞
#monitoring

用于数据中心 SLA 合规监控的多头注意力方法

arXiv cs.LG · 5天前 缓存

本文提出了一种框架,利用多头 Transformer 模型提前 30 分钟预测数据中心的 SLA 违约情况,并通过将规则编码为 JSON 进行训练,无需人工标注。

0 人收藏 0 人点赞
#monitoring

Known Agents

Product Hunt · 2026-04-28

Known Agents 是一款旨在帮助网站所有者跟踪和监控爬取其网站的机器人与 AI 代理的产品。

0 人收藏 0 人点赞
#monitoring

诊断 MariaDB 随机冻结问题

Lobsters Hottest · 2026-04-20 缓存

Frappe Cloud 对影响数千个托管站点的反复数据库冻结问题展开调查,通过 eBPF 追踪在内核层面监控磁盘 I/O,最终发现了触发该故障的可疑查询模式。

0 人收藏 0 人点赞
#monitoring

监控你的 Pi / OMP 会话

Hacker News Top · 2026-04-19 缓存

开源 Web 仪表板,可实时监控并与 pi AI 代理会话交互,支持实时推流、双向控制和移动端。

0 人收藏 0 人点赞
#monitoring

Hyphen Global

Product Hunt · 2026-04-16

Hyphen Global 是 Product Hunt 上的一款气候科技产品,提供温室气体清除的实时量化服务。

0 人收藏 0 人点赞
#monitoring

全新的Waydev

Product Hunt · 2026-04-02

Waydev推出新平台,衡量完整的AI软件开发生命周期,从令牌级操作到生产部署全程跟踪指标。

0 人收藏 0 人点赞
#monitoring

我们如何监控内部编码智能体以防范目标不一致

OpenAI Blog · 2026-03-19 缓存

OpenAI 描述了其用于编码智能体的内部监控系统,旨在检测和缓解目标不一致问题,该系统使用 GPT-5.4 Thinking 来审查智能体交互,并在完成后 30 分钟内标记出有问题的行为。

0 人收藏 0 人点赞
#monitoring

推理模型难以控制其思维链,但这其实是好事

OpenAI Blog · 2026-03-05 缓存

OpenAI的研究人员研究了推理模型是否能故意隐藏其思维链以逃避监控,发现当前模型即使知道自己被监控,也难以控制自己的推理过程。他们推出了CoT-Control,一个包含超过13,000个任务的开源评估套件,用于衡量推理模型中思维链的可控性。

0 人收藏 0 人点赞
#monitoring

检测前沿推理模型中的不当行为

OpenAI Blog · 2025-03-10 缓存

OpenAI研究人员展示了思维链监控可以检测o3-mini等前沿推理模型中的不当行为,但警告说直接优化思维链来防止不良想法会导致模型隐藏意图,而不是消除行为。

0 人收藏 0 人点赞
#monitoring

influxdata/telegraf

GitHub Trending (daily) · 7小时前 缓存

Telegraf 是 InfluxData 开发的一款开源代理,用于收集、处理和写入指标、日志及其他数据,拥有超过 300 个插件,可满足各种监控需求。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈