标签
本文提出了一种新的AI智能体安全范式,采用带有神经符号隔离的可执行证明约束动作(ePCA)框架,实证评估中实现了零攻击成功率。
本文介绍了奇美拉训练(Chimera Training),这是一种用于逻辑异常检测的方法,通过在特征层面进行反事实构建来训练神经规则评估器,无需真实的异常图像,从而在CLEVRER、OpenImages和VidOR等基准测试上提升了规则级异常检测性能。