什么是AI tarpits？了解人们用来给LLMs投毒的工具

Reddit r/ArtificialInteligence 2026/05/17 19:45 新闻

ai-poisoning tarpits llm-security data-poisoning nightshade nepenthes iocaine

摘要

AI tarpits是内容创作者用来给大型语言模型投毒的工具，通过向爬虫提供无用或错误的数据，降低AI输出质量。

“为了让聊天机器人变得更智能，从而对最终用户更有用，它需要持续吸收数据。这个过程被称为‘训练’。问题是，许多[AI](https://www.fastcompany.com/section/artificial-intelligence)公司在抓取网页并将其数据添加到驱动AI聊天机器人的[大型语言模型的语料库](https://www.fastcompany.com/90916291/what-is-a-corpus-ai-corpora-chatgpt)（LLMs）之前，从未明确征求数据所有者的同意。” “但其中一些数据所有者，也就是所谓的内容创作者或知识产权持有者，现在开始反击。他们使用被称为‘tarpits’的工具来实现这一目的。他们的目标是什么？对聊天机器人底层LLM进行投毒，从而降低其输出质量，最终可能导致用户流失。”

查看原文

查看缓存全文

缓存时间: 2026/05/17 20:24

# 什么是AI陷阱？了解人们用于毒害LLM的工具来源：https://tech.yahoo.com/ai/articles/ai-tarpits-understanding-tools-people-090000300.html 为了让聊天机器人变得更智能，从而对终端用户更有用，它需要持续吸收数据。这个过程被称为“训练”。问题在于，许多AI公司在抓取网页并将数据添加到驱动AI聊天机器人的大型语言模型（LLM）的语料库之前，从未明确征求数据所有者的同意。更多来自 Fast Company 的热门文章但一些数据所有者——也就是内容创作者或知识产权持有者——现在正在反击。他们使用的工具被称为“tarpits”（陷阱）。他们的目标？毒化聊天机器人底层的LLM，从而降低其输出质量，可能导致终端用户流失。以下是你需要了解的内容。 ## 什么是AI投毒？ AI投毒是指通过污染AI聊天机器人底层的大型语言模型，使聊天机器人输出错误、误导或完全荒谬的信息。这种污染是通过诱使LLM在训练过程中吸收错误数据实现的——训练通常涉及抓取所有能找到的网页和图片。根据投毒者想要破坏的LLM的能力不同，投毒的方式也多种多样。例如，如果有人想毒化一个图像生成LLM，他们可以使用一种名为“Nightshading”（夜影）的技术，该技术使用一个名为Nightshade的软件，在图像上添加一层人眼不可见但对LLM抓取器可见的像素层。这些像素会使AI认为该艺术作品处于与实际不同的风格（例如，抽象风格而非写实风格），从而阻止LLM模仿艺术家的真实风格。当然，大多数聊天机器人处理的是文本而非图像，这使得像Nightshade这样的投毒工具对未经授权的AI抓取文章和博客内容无效。但在过去几年中，一种新型的AI投毒工具开始流行，其目的是诱使LLM在无用的数据上进行训练。这些工具被称为“tarpits”。 ## 什么是AI tarpits？ AI tarpits是一种特定类型的AI投毒工具，旨在诱使LLM使用的抓取器吸收无用的数据。由于LLM随后使用这些垃圾数据生成文本输出，输出结果将是错误的，从而降低AI回复的质量，并最终可能阻止用户使用该聊天机器人。内容创作者和知识产权持有者可以在其网站上添加多种tarpit陷阱，包括Nepenthes、Iocaine和Quixotic。当LLM抓取器访问一个嵌入了tarpit代码的网站时，抓取器会被重定向去吸收自动生成的、无用的文本——这些文本要么充斥着错误信息（例如，“史蒂夫·乔布斯于1834年创立了微软”），要么完全是胡言乱语（例如，“水的颜色是意大利辣香肠”）。此外，这些被污染文本的页面会包含指向更多被污染文本页面的链接，而这些页面都没有出口链接。因此，就像现实中的物理陷阱会让动物陷入困境一样，AI tarpit会将LLM抓取器困在无限吸收错误数据的过程中，无法脱离陷阱。 ## 普通用户如何保护自己的数据免受AI公司侵犯？内容创作者和知识产权持有者使用tarpits来浪费AI公司的宝贵资源，并防止LLM在未经同意的情况下吸收网站数据。但即使你不是内容创作者或知识产权持有者，你也应该知道AI公司正在使用你的数据来训练他们的模型。你每次向AI聊天机器人输入的提示或与它的对话，都会被吸收到该LLM的语料库中，用于进一步分析，目的是让聊天机器人的LLM更加强大。好消息是，你不必求助于像tarpits这样的专业工具来保护你的数据免受聊天机器人侵犯。相反，你可以明确指示聊天机器人不要在你的数据上进行训练，通过代理使用聊天机器人来隐藏你的身份，或者在上传任何文件给聊天机器人分析之前，使用日常软件工具对你的敏感数据进行编辑。这篇文章最初发布于fastcompany.com。 *订阅获取 Fast Company 新闻通讯：* http://fastcompany.com/newsletters

相似文章

AI 垃圾内容正在扼杀在线社区

Hacker News Top

文章认为，在 GitHub 和博客等平台上泛滥的低质量 AI 生成内容（即“AI 垃圾内容”）正在降低在线技术社区的价值。

我找到了对抗AI内容垃圾的方法

Reddit r/artificial

作者提出将AI作为研究筛选和综合工具，而非内容生成器，以对抗“AI内容垃圾”。通过构建一个比较并排名专家来源的自动化流程，作者认为未来人类在AI时代的主要角色将是策展人、筛选者和判断者。

为大语言模型辅助的生物威胁创建构建早期预警系统

OpenAI Blog

# 为大语言模型辅助的生物威胁创建构建早期预警系统来源：[https://openai.com/index/building-an-early-warning-system-for-llm-aided-biological-threat-creation/](https://openai.com/index/building-an-early-warning-system-for-llm-aided-biological-threat-creation/) *注：作为我们*[*预防性框架*⁠](https://openai.com/preparedness/)*的一部分，我们正在投资开发改进的AI赋能型安全风险评估方法。我们相信这些努力*

技能成为新的代码检查工具

Reddit r/AI_Agents

作者认为，使用AI技能来自动化代码质量检查，会重现代码检查工具最初旨在解决的内存与可靠性问题，从而质疑基于大语言模型的技能作为替代方案的有效性。

LineageLens

Product Hunt

LineageLens 是一个检测 AI 生成内容的工具，可以证明文本是否由 AI 撰写。