paraphrasing-attack

标签

Cards List
#paraphrasing-attack

各类AI生成文本检测方法在面对释义攻击时的鲁棒性

arXiv cs.LG · 2026-05-15 缓存

本文研究了AI生成文本检测方法(微调后的RoBERTa、Binoculars、文本特征分析及其集成方法)在面对释义攻击时的鲁棒性。研究发现,包含Binoculars的集成方法效果最强,但在攻击中损失也最大,揭示了性能与鲁棒性之间的二分法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈