paraphrasing-attack

#paraphrasing-attack

各类AI生成文本检测方法在面对释义攻击时的鲁棒性

arXiv cs.LG ↗ · 2026-05-15 缓存

本文研究了AI生成文本检测方法（微调后的RoBERTa、Binoculars、文本特征分析及其集成方法）在面对释义攻击时的鲁棒性。研究发现，包含Binoculars的集成方法效果最强，但在攻击中损失也最大，揭示了性能与鲁棒性之间的二分法。

0 人收藏 0 人点赞