'AI slop!' 指责的兴起正成为一种新的把关形式

Reddit r/ArtificialInteligence 新闻

摘要

一项新研究分析了 Reddit 和 Hacker News 上的 2500 万条评论,发现对 'AI slop' 的指责急剧上升,这些指责往往针对人类评论且没有证据,其作用更像是一种社交把关,而非准确的 AI 检测。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/06/12 12:55

# “AI垃圾!”指控的兴起正成为一种新的守门形式 来源:https://www.unite.ai/the-rise-of-ai-slop-accusations-is-becoming-a-new-form-of-gatekeeping **将某物称为“AI垃圾”已成为互联网的新猎巫行动——Reddit和Hacker News的用户越来越频繁地指控其他评论者是机器人,即使没有任何证据。** 挪威和阿联酋的一项新研究发现,在2023年至2026年间,Reddit和Hacker News上对其他评论者所谓“AI垃圾”的指控显著增加,即使该评论并未表现出任何AI生成的迹象。 作者对2500万条评论的分析结果表明,这些指控越来越多地作为一种新兴的*社会性守门*形式发挥作用,而非识别AI的方式。 研究人员还发现,技术类社群比其他群体更早地接受了这种“指控文化”,随后这种模式蔓延到Reddit的更广泛领域。 这种针对“AI垃圾”指控的明显上升,似乎并非网络敌意更广泛或普遍增长的一部分:同期,像**“托儿”**、**“马甲”**和**“喷子”**这类较旧的侮辱性词汇保持相对稳定,这表明对AI的怀疑是作为一种新的社会边界监管形式出现的,而非早期网络争执的延续或延伸。 论文指出: **“我们分析了Hacker News和Reddit(2023-2026年)的2500万条评论,结合了LLM对7500个AI使用指控样本的判断、情感轨迹、对300个确认的AI使用指控的言语行为编码,以及一个匹配对照测试(比较被指控与未被指控的父评论)。** **“我们发现,在两个平台上,贬义标签在指控中的占比增长了十倍以上,而2022年之前的不真实术语(‘托儿’、‘虚假草根运动’)的安慰剂词汇并未出现同样增长。** **“这种转变反映了一个快速增长的趋势:将任何可疑或看似不真实的文字都标记为‘AI垃圾’。** **“‘垃圾’框架现在占贬义提及的94%,主导评论的语气从嘲讽转向守门和结构性抗议。”** 这项研究提出了一个更广泛的问题:人们是否真的能识别AI写作,因为流畅的散文——以前被视为努力、专业知识或真诚参与的标志——现在已经变成一种丰富且越来越被贬值的商品。 值得注意的是,这项新研究聚焦于Hacker News(该平台对AI生成的评论进行**严格监管**)和Reddit(其持续不断的人类话语流现在对AI开发者和公司来说**价值极高**,同时也成为意图通过代理入侵基于LLM网页排名的SEO垃圾邮件发送者的新主要目标)。 研究人员认为,他们的发现与公众日益增长的认识一致,即随着AI使用的普及,之前的可信来源可能会**贬值**。这篇新论文讨论了真实人们被误认为是AI实体的情况,源于真正的错误、**风格上的混淆**,或是恶意(即指控者明知对方是人类,却想压制他们);但也预测了其他类型的交流也会受到类似的玷污: **“我们的结果预测,类似的AI使用指控将出现在图像认证、语音认证和代码作者身份等领域,其核心意图是守门,而非经验性地准确检测AI使用情况。** **“随着这些领域的AI减少甚至专家能够发现的、经验性可检测的线索,这将变得越来越成问题。** **“这可能会导致以下后果:要么增加专家在验证AI与非AI内容方面的作用;要么极大地降低对任何可能由AI生成的媒介类型的信任。”** 这篇**新论文**的标题为**“那是AI垃圾,你这个机器人!”:研究针对LLM生成评论的指控、证据和可信度**,来自奥斯陆大学和沙迦美国大学的两位评审者。 ## **方法** 为这项新研究开发的数据集包含2023年1月至2026年5月期间发布在Hacker News和18个选定的Reddit社区上的所有公共评论。 共整理约2500万条评论,其中1200万条来自Hacker News,1300万条来自Reddit。Reddit数据通过其公共JSON API从Arctic Shift存档获取,而Hacker News评论则从Algolia Hacker News搜索存档收集。 为了避免只关注单一类型的社区,Reddit样本被分为AI聚焦论坛(包括**r/aiwars**、**r/ArtistHate**、**r/ChatGPT**、**r/OpenAI**、**r/MachineLearning**、**r/LocalLLaMA**和**r/singularity**);创作类社区(包括**r/Art**、**r/writing**和**r/books**);一般兴趣论坛(**r/AskReddit**、**r/news**、**r/changemyview**、**r/explainlikeimfive**、**r/AskHistorians**和**r/science**);以及技术导向和学术社区(**r/programming**和**r/AskAcademia**)。 采样率在所有时间段保持一致,以确保指控率的变化反映的是社群行为的转变,而非数据收集的变化。 ### **AI羞辱的五个级别** 使用包含137种模式的搜索词汇表识别候选评论,该词汇表分为五个命名层级:第一层(**“直接”**)捕获明确的指控,如**“这是ChatGPT写的”**、**“这是AI生成的?”**和**“楼主是机器人”**。 第二层(**“贬义”**)涵盖**“AI垃圾”**、**“GPT垃圾”**、**“ML胡言乱语”**和**“机器人写作”**等标签。第三层(**“风格”**)涉及所谓的形式特征,包括提到**em dash**、**“delve”** 特征、**tricolon**引用,以及关于“经典AI签名”的更广泛声明。 第四层(**“嘲讽”**)捕捉基于常见AI助手短语的恶搞和模仿,例如**“人类同胞们”**、**“在快速发展的格局中”**和**“丰富的织锦”**。第五层(**“间接”**)包含较不明确的怀疑,描述为**“闻起来像AI”**、**“读起来像ChatGPT”**或类似**“写作的恐怖谷”**的评论。 为减少误报,常见短语如**“值得注意的是”**、**“需要指出的是”**和**“这是人类吗”**仅在附近出现AI相关术语时才被计数。由于这些搜索模式无法可靠地区分指控和普通讨论,随后使用Claude Opus 4.7进行了两次验证。 从候选池中抽取了一个包含5000条Reddit评论和2500条Hacker News评论的样本,并在时间段和指控类别之间保持平衡。 然后每条评论被分类为五个结果组之一:**真实**(覆盖真正的AI使用指控);**披露**(覆盖承认AI作者身份的评论);**中性引用**(覆盖非指控性的AI引用);**误报**(覆盖正则表达式误报);以及**模糊**(覆盖可用上下文无法做出判断的情况)。 研究人员还考察了指控随时间的变化,追踪较新的**“AI垃圾”**框架相对于较旧侮辱性词汇(如**“胡言乱语”**、**“垃圾”**、**“废物”**、**“呕吐物”**、**“污泥”**、**“稀糊”**、**“黏稠物”**、**“无用物”**、**“废话”**、**“词语沙拉”**和**“无意义”**)的兴起。 ### **界定趋势** 使用情感分析工具VADER测量情感趋势,同时根据所执行的社会角色对300个包含LLM验证的**真实**指控的Reddit帖子进行了编码。这些被分类为**轻蔑**(轻蔑的嘲讽)、**否决**(直接拒绝)、**嘲弄**(模仿/恶搞)、**守门**(“规则执行”)或**结构性抗议**(对AI的一般反对),从而追踪AI指控特征随时间的变化。 还设计了一个单独的“安慰剂”测试,以确定AI指控的增加是否仅仅反映了更广泛的网络怀疑情绪增长:在相同的数据集中搜索了更早的ChatGPT前不真实术语,如**“托儿”**、**“虚假草根”**、**“马甲”**、**“付费托儿”**、**“假账号”**、**“企业托儿”**、**“谈话要点”**和**“贿赂”**。 最后一系列测试考察了区分AI生成文本与人类文本的特征,是否与导致人类撰写的评论被指控为AI的特征相同。通过检查六个语言标记来实现:*冠词密度*、*缩写率*、*正式语域副词频率*、*介词密度*、*句子长度方差*和*平均标记长度*。对**披露**和**真实**评论之间使用Mann-Whitney U检验进行比较。 检索了800个LLM验证的真实Reddit指控相关的父评论,其中421个案例中父评论本身是评论而非顶层帖子。这些与来自同一子版块和月份的2048条未被指控的评论进行匹配。然后使用逻辑回归测试区分AI生成文本与人类文本的语言标记,是否也能预测哪些人类撰写的评论会招致AI使用指控。 ## **结果** 该研究记录了2023年至2026年间Reddit和Hacker News上AI指控的大幅增长。大部分增长集中在贬义标签的使用上: *2023年1月至2026年5月期间Reddit和Hacker News上贬义AI指控的跨平台增长。第二层(“贬义”)指控从低个位数上升到两个平台上候选指控的大约四分之一。在2024年和2025年间可以看到三个加速期,之后增长趋于平稳。在研究期间的大部分时间里,Hacker News的比率高于Reddit,但到2026年两者趋于相似水平。* 来源:https://arxiv.org/pdf/2606.12073 到2026年,“AI垃圾”占数据集中识别出的贬义AI指控的94%,取代了之前的术语如*“GPT垃圾”*、*“ML胡言乱语”*和*“机器人写作”*。根据论文,研究期间两个平台上贬义AI指控的占比增加了十倍以上: *2023年至2026年间“AI垃圾”标签相对于较旧贬义AI指控的崛起。虽然诸如“胡言乱语”、“垃圾”、“废物”、“呕吐物”、“污泥”、“稀糊”、“黏稠物”、“无用物”、“废话”、“词语沙拉”和“无意义”等术语最初在贬义指控中占主导地位,但它们的份额稳步下降,“AI垃圾”成为压倒性的首选标签。到2026年,“垃圾”框架约占贬义AI指控的94%,表明指控语言集中到了单一术语。* 还使用较旧的不真实术语集(包括**“托儿”**、**“虚假草根”**、**“马甲”**、**“付费托儿”**、**“假账号”**、**“企业托儿”**、**“谈话要点”**和**“贿赂”**)进行了单独比较。与聚焦AI的指控不同,这些术语没有出现类似的增长。 在不同社区之间也观察到了差异:AI聚焦和技术导向的论坛记录了更早的增长——类似的模式后来出现在Reddit和Hacker News的其他部分。 不仅指控的频率发生了变化,其分类也发生了变化。对300个验证过的Reddit指控进行编码发现,**轻蔑**、**否决**、**嘲弄**、**守门**和**结构性抗议**的相对占比发生了转变。根据论文,**守门**和**结构性抗议**随时间变得更加普遍,而**轻蔑**和**嘲弄**则变得不那么常见。 ## **结论** 评论区内随意的AI羞辱现象显然需要自己的**戈德温定律**迭代;基于近年来社会和政治评论中的事件和趋势,AI机器人很有可能成为**最有可能指责其他评论者是机器人**的群体;然而,这很可能压制所有关于此事的评论。 ***请注意:这篇论文并不适合轻松阅读,其语气和词汇是针对作者学术同行而设计的。** **首次发布:2026年6月12日,星期五**

相似文章

AI 垃圾内容正在扼杀在线社区

Hacker News Top

文章认为,在 GitHub 和博客等平台上泛滥的低质量 AI 生成内容(即“AI 垃圾内容”)正在降低在线技术社区的价值。

在我看来 AI撰写 != Slop

Reddit r/AI_Agents

一篇观点文章讨论了将真实艺术作品标记为AI生成如何导致错误的批评,并指出'slop'的定义是缺乏人类故事,而非AI参与。

我找到了对抗AI内容垃圾的方法

Reddit r/artificial

作者提出将AI作为研究筛选和综合工具,而非内容生成器,以对抗“AI内容垃圾”。通过构建一个比较并排名专家来源的自动化流程,作者认为未来人类在AI时代的主要角色将是策展人、筛选者和判断者。