标签
本文提出了一种非参数多视图高斯过程框架,用于检测机器生成的文本,该框架对诸如释义等对抗性操作具有鲁棒性。通过结合互补特征并提供校准的不确定性,它在保留攻击上优于现有检测器。
本文研究了对机器文本检测器的规避攻击,发现虽然当前攻击会降低检测器性能,但风格指纹仍然存在。一种模仿人类风格的新型释义方法能够规避甚至基于风格的检测器,但多文档分析可恢复可检测性。