标签
本文利用平行圣经翻译引入了一种受控内容重叠设置,用于评估风格分类器在多大程度上依赖内容线索而非实际风格特征。结果表明,当移除内容线索时,低重叠模型性能下降,而高重叠模型则迁移得更为稳健。
本文表明,微调后的AI文本检测器放大了预训练的典型性轴,而非学习AI与人类之间的界限,原始编码器投影通常达到或超过微调后的性能。
苏黎世联邦理工学院的研究人员表明,经过微调的RoBERTa模型可从ChatGPT聊天日志中以高于随机44%的准确率推断用户的大五人格特征,凸显对话AI的隐私风险。