'AI slop!' 指责的兴起正成为一种新的把关形式

Reddit r/ArtificialInteligence 2026/06/12 12:38 新闻

ai-slop gatekeeping social-media reddit hacker-news research online-behavior

摘要

一项新研究分析了 Reddit 和 Hacker News 上的 2500 万条评论，发现对 'AI slop' 的指责急剧上升，这些指责往往针对人类评论且没有证据，其作用更像是一种社交把关，而非准确的 AI 检测。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/12 12:55

# “AI垃圾！”指控的兴起正成为一种新的守门形式来源：https://www.unite.ai/the-rise-of-ai-slop-accusations-is-becoming-a-new-form-of-gatekeeping **将某物称为“AI垃圾”已成为互联网的新猎巫行动——Reddit和Hacker News的用户越来越频繁地指控其他评论者是机器人，即使没有任何证据。** 挪威和阿联酋的一项新研究发现，在2023年至2026年间，Reddit和Hacker News上对其他评论者所谓“AI垃圾”的指控显著增加，即使该评论并未表现出任何AI生成的迹象。作者对2500万条评论的分析结果表明，这些指控越来越多地作为一种新兴的*社会性守门*形式发挥作用，而非识别AI的方式。研究人员还发现，技术类社群比其他群体更早地接受了这种“指控文化”，随后这种模式蔓延到Reddit的更广泛领域。这种针对“AI垃圾”指控的明显上升，似乎并非网络敌意更广泛或普遍增长的一部分：同期，像**“托儿”**、**“马甲”**和**“喷子”**这类较旧的侮辱性词汇保持相对稳定，这表明对AI的怀疑是作为一种新的社会边界监管形式出现的，而非早期网络争执的延续或延伸。论文指出： **“我们分析了Hacker News和Reddit（2023-2026年）的2500万条评论，结合了LLM对7500个AI使用指控样本的判断、情感轨迹、对300个确认的AI使用指控的言语行为编码，以及一个匹配对照测试（比较被指控与未被指控的父评论）。** **“我们发现，在两个平台上，贬义标签在指控中的占比增长了十倍以上，而2022年之前的不真实术语（‘托儿’、‘虚假草根运动’）的安慰剂词汇并未出现同样增长。** **“这种转变反映了一个快速增长的趋势：将任何可疑或看似不真实的文字都标记为‘AI垃圾’。** **“‘垃圾’框架现在占贬义提及的94%，主导评论的语气从嘲讽转向守门和结构性抗议。”** 这项研究提出了一个更广泛的问题：人们是否真的能识别AI写作，因为流畅的散文——以前被视为努力、专业知识或真诚参与的标志——现在已经变成一种丰富且越来越被贬值的商品。值得注意的是，这项新研究聚焦于Hacker News（该平台对AI生成的评论进行**严格监管**）和Reddit（其持续不断的人类话语流现在对AI开发者和公司来说**价值极高**，同时也成为意图通过代理入侵基于LLM网页排名的SEO垃圾邮件发送者的新主要目标）。研究人员认为，他们的发现与公众日益增长的认识一致，即随着AI使用的普及，之前的可信来源可能会**贬值**。这篇新论文讨论了真实人们被误认为是AI实体的情况，源于真正的错误、**风格上的混淆**，或是恶意（即指控者明知对方是人类，却想压制他们）；但也预测了其他类型的交流也会受到类似的玷污： **“我们的结果预测，类似的AI使用指控将出现在图像认证、语音认证和代码作者身份等领域，其核心意图是守门，而非经验性地准确检测AI使用情况。** **“随着这些领域的AI减少甚至专家能够发现的、经验性可检测的线索，这将变得越来越成问题。** **“这可能会导致以下后果：要么增加专家在验证AI与非AI内容方面的作用；要么极大地降低对任何可能由AI生成的媒介类型的信任。”** 这篇**新论文**的标题为**“那是AI垃圾，你这个机器人！”：研究针对LLM生成评论的指控、证据和可信度**，来自奥斯陆大学和沙迦美国大学的两位评审者。 ## **方法** 为这项新研究开发的数据集包含2023年1月至2026年5月期间发布在Hacker News和18个选定的Reddit社区上的所有公共评论。共整理约2500万条评论，其中1200万条来自Hacker News，1300万条来自Reddit。Reddit数据通过其公共JSON API从Arctic Shift存档获取，而Hacker News评论则从Algolia Hacker News搜索存档收集。为了避免只关注单一类型的社区，Reddit样本被分为AI聚焦论坛（包括**r/aiwars**、**r/ArtistHate**、**r/ChatGPT**、**r/OpenAI**、**r/MachineLearning**、**r/LocalLLaMA**和**r/singularity**）；创作类社区（包括**r/Art**、**r/writing**和**r/books**）；一般兴趣论坛（**r/AskReddit**、**r/news**、**r/changemyview**、**r/explainlikeimfive**、**r/AskHistorians**和**r/science**）；以及技术导向和学术社区（**r/programming**和**r/AskAcademia**）。采样率在所有时间段保持一致，以确保指控率的变化反映的是社群行为的转变，而非数据收集的变化。 ### **AI羞辱的五个级别** 使用包含137种模式的搜索词汇表识别候选评论，该词汇表分为五个命名层级：第一层（**“直接”**）捕获明确的指控，如**“这是ChatGPT写的”**、**“这是AI生成的？”**和**“楼主是机器人”**。第二层（**“贬义”**）涵盖**“AI垃圾”**、**“GPT垃圾”**、**“ML胡言乱语”**和**“机器人写作”**等标签。第三层（**“风格”**）涉及所谓的形式特征，包括提到**em dash**、**“delve”** 特征、**tricolon**引用，以及关于“经典AI签名”的更广泛声明。第四层（**“嘲讽”**）捕捉基于常见AI助手短语的恶搞和模仿，例如**“人类同胞们”**、**“在快速发展的格局中”**和**“丰富的织锦”**。第五层（**“间接”**）包含较不明确的怀疑，描述为**“闻起来像AI”**、**“读起来像ChatGPT”**或类似**“写作的恐怖谷”**的评论。为减少误报，常见短语如**“值得注意的是”**、**“需要指出的是”**和**“这是人类吗”**仅在附近出现AI相关术语时才被计数。由于这些搜索模式无法可靠地区分指控和普通讨论，随后使用Claude Opus 4.7进行了两次验证。从候选池中抽取了一个包含5000条Reddit评论和2500条Hacker News评论的样本，并在时间段和指控类别之间保持平衡。然后每条评论被分类为五个结果组之一：**真实**（覆盖真正的AI使用指控）；**披露**（覆盖承认AI作者身份的评论）；**中性引用**（覆盖非指控性的AI引用）；**误报**（覆盖正则表达式误报）；以及**模糊**（覆盖可用上下文无法做出判断的情况）。研究人员还考察了指控随时间的变化，追踪较新的**“AI垃圾”**框架相对于较旧侮辱性词汇（如**“胡言乱语”**、**“垃圾”**、**“废物”**、**“呕吐物”**、**“污泥”**、**“稀糊”**、**“黏稠物”**、**“无用物”**、**“废话”**、**“词语沙拉”**和**“无意义”**）的兴起。 ### **界定趋势** 使用情感分析工具VADER测量情感趋势，同时根据所执行的社会角色对300个包含LLM验证的**真实**指控的Reddit帖子进行了编码。这些被分类为**轻蔑**（轻蔑的嘲讽）、**否决**（直接拒绝）、**嘲弄**（模仿/恶搞）、**守门**（“规则执行”）或**结构性抗议**（对AI的一般反对），从而追踪AI指控特征随时间的变化。还设计了一个单独的“安慰剂”测试，以确定AI指控的增加是否仅仅反映了更广泛的网络怀疑情绪增长：在相同的数据集中搜索了更早的ChatGPT前不真实术语，如**“托儿”**、**“虚假草根”**、**“马甲”**、**“付费托儿”**、**“假账号”**、**“企业托儿”**、**“谈话要点”**和**“贿赂”**。最后一系列测试考察了区分AI生成文本与人类文本的特征，是否与导致人类撰写的评论被指控为AI的特征相同。通过检查六个语言标记来实现：*冠词密度*、*缩写率*、*正式语域副词频率*、*介词密度*、*句子长度方差*和*平均标记长度*。对**披露**和**真实**评论之间使用Mann-Whitney U检验进行比较。检索了800个LLM验证的真实Reddit指控相关的父评论，其中421个案例中父评论本身是评论而非顶层帖子。这些与来自同一子版块和月份的2048条未被指控的评论进行匹配。然后使用逻辑回归测试区分AI生成文本与人类文本的语言标记，是否也能预测哪些人类撰写的评论会招致AI使用指控。 ## **结果** 该研究记录了2023年至2026年间Reddit和Hacker News上AI指控的大幅增长。大部分增长集中在贬义标签的使用上： *2023年1月至2026年5月期间Reddit和Hacker News上贬义AI指控的跨平台增长。第二层（“贬义”）指控从低个位数上升到两个平台上候选指控的大约四分之一。在2024年和2025年间可以看到三个加速期，之后增长趋于平稳。在研究期间的大部分时间里，Hacker News的比率高于Reddit，但到2026年两者趋于相似水平。* 来源：https://arxiv.org/pdf/2606.12073 到2026年，“AI垃圾”占数据集中识别出的贬义AI指控的94%，取代了之前的术语如*“GPT垃圾”*、*“ML胡言乱语”*和*“机器人写作”*。根据论文，研究期间两个平台上贬义AI指控的占比增加了十倍以上： *2023年至2026年间“AI垃圾”标签相对于较旧贬义AI指控的崛起。虽然诸如“胡言乱语”、“垃圾”、“废物”、“呕吐物”、“污泥”、“稀糊”、“黏稠物”、“无用物”、“废话”、“词语沙拉”和“无意义”等术语最初在贬义指控中占主导地位，但它们的份额稳步下降，“AI垃圾”成为压倒性的首选标签。到2026年，“垃圾”框架约占贬义AI指控的94%，表明指控语言集中到了单一术语。* 还使用较旧的不真实术语集（包括**“托儿”**、**“虚假草根”**、**“马甲”**、**“付费托儿”**、**“假账号”**、**“企业托儿”**、**“谈话要点”**和**“贿赂”**）进行了单独比较。与聚焦AI的指控不同，这些术语没有出现类似的增长。在不同社区之间也观察到了差异：AI聚焦和技术导向的论坛记录了更早的增长——类似的模式后来出现在Reddit和Hacker News的其他部分。不仅指控的频率发生了变化，其分类也发生了变化。对300个验证过的Reddit指控进行编码发现，**轻蔑**、**否决**、**嘲弄**、**守门**和**结构性抗议**的相对占比发生了转变。根据论文，**守门**和**结构性抗议**随时间变得更加普遍，而**轻蔑**和**嘲弄**则变得不那么常见。 ## **结论** 评论区内随意的AI羞辱现象显然需要自己的**戈德温定律**迭代；基于近年来社会和政治评论中的事件和趋势，AI机器人很有可能成为**最有可能指责其他评论者是机器人**的群体；然而，这很可能压制所有关于此事的评论。 ***请注意：这篇论文并不适合轻松阅读，其语气和词汇是针对作者学术同行而设计的。** **首次发布：2026年6月12日，星期五**

'AI slop!' 指责的兴起正成为一种新的把关形式

相似文章

AI 垃圾内容正在扼杀在线社区

数据中心抗议活动中有多少是真正的AI垃圾内容？（赠阅链接）

AI垃圾内容正在成为一场溯源危机，而不仅仅是内容质量的问题

在我看来 AI撰写 != Slop

我找到了对抗AI内容垃圾的方法

提交意见反馈