llm-monitoring

标签

Cards List
#llm-monitoring

构建独立LLM漂移检测 - 分享方法论,寻求对方法的反馈

Reddit r/artificial · 2026-06-18

作者分享了一种构建外部LLM漂移检测系统的方法论,该系统持续探测模型行为(模式遵循、指令遵循、拒绝率等),以捕捉API性能的静默退化,并邀请对方法、定价和用例的反馈。

0 人收藏 0 人点赞
#llm-monitoring

一行系统提示修改将模型质量从84%降至52%。人们在生产环境中如何监控语义质量?

Reddit r/AI_Agents · 2026-05-08

一位开发者分享了他们的经历:一个系统提示的修改导致LLM回答质量下降,却没有触发传统的监控告警,并介绍了他们为监控生产环境中LLM应用的语义质量而构建的内部工具。

0 人收藏 0 人点赞
#llm-monitoring

大多数注入检测器逐条打分,我做了个追踪完整会话几何轨迹的,这是实测结果

Reddit r/artificial · 2026-04-20

开发者构建了 Arc Gate——一款基于 Fisher 信息流形几何的 LLM 监控代理,可在会话层面检测提示注入攻击,通过追踪 t 值相对相变阈值 t*=1.2247 的变化,识别 Crescendo 式渐进操控,而非逐句关键词匹配。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈