behavioral-drift

标签

Cards List
#behavioral-drift

监控和审计自主AI代理运行时行为的最佳工具:生产环境中哪些真正有效?

Reddit r/AI_Agents · 4小时前

一位从业者分享了在生产环境中监控自主AI代理的挑战和工具,涵盖了运行时提示注入检测、带推理轨迹的工具调用审计、行为漂移检测以及多代理授权,同时测试了Arize Phoenix、Protect AI Guardian、Metoro、Alice、Asqav和Microsoft Agent Governance Toolkit等工具。

0 人收藏 0 人点赞
#behavioral-drift

MemEvoBench:LLM 代理内存误演化基准测试

arXiv cs.CL · 2026-04-20 缓存

MemEvoBench 引入了首个用于评估 LLM 代理内存安全性的基准测试,衡量对抗性内存注入、噪声输出和有偏反馈在问答与工作流任务中导致的行为衰退。该研究表明内存演化是安全失败的重要因素,且静态防御措施不足以应对。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈