post-hoc-analysis

标签

Cards List
#post-hoc-analysis

MemAudit:通过因果归因与结构异常检测对受污染代理记忆进行事后审计

arXiv cs.AI · 2026-05-25 缓存

MemAudit 是一种针对记忆增强型 LLM 代理的事后审计框架,它通过结合反事实影响分数和结构异常检测来识别受污染的记忆,在现实场景中将攻击成功率从超过 70% 降低至 0%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈