标签
来自肯尼索州立大学的研究人员利用可解释语言特征(词汇多样性、可读性、情感特征)对检测AI生成假新闻的跨提示词泛化能力展开研究。在一种提示策略上训练、在另一种提示策略上测试的随机森林分类器取得了0.988至1.000的AUC值,表明这些特征能够捕捉AI生成文本的稳定且可泛化的属性。
本文介绍了一种利用数据驱动拉回几何的黎曼原型分析,将可解释性与非线性表达能力相结合,提出了黎曼原型映射(RAM),并在合成数据和MNIST上展示了其有效性。