semantic-norm-drift

标签

Cards List
#semantic-norm-drift

误判鸿沟:当记忆投毒在自主AI系统中看似模型故障

arXiv cs.AI · 2026-05-25 缓存

本文识别了多智能体AI流水线中的一种结构性缺陷,即记忆层攻击可能被误判为模型失调,形式化定义了语义规范漂移(SND),并提出反事实组合测试(Counterfactual Composition Testing)和持久记忆信息流控制(Memory-Persistent Information-Flow Control)作为防御措施。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈