标签
本文将上下文夹带从标记级扩展到句子级,表明提示中的反事实句子在推理时也会增加其概率。该效应随模型规模增大而减弱,且由2-4%的注意力头驱动,这些注意力头可被消融而不影响性能。
本文提出了SenFlow,一种用于混合文档中句子级AI生成文本检测的方法,通过建模句子间依赖关系,利用图传播和线性链CRF解码。同时引入了MOSAIC基准测试,包含由DeepSeek-V3.2和Kimi K2生成的16,000篇文档,达到了最先进的性能。