什么是AI tarpits?了解人们用来给LLMs投毒的工具
摘要
AI tarpits是内容创作者用来给大型语言模型投毒的工具,通过向爬虫提供无用或错误的数据,降低AI输出质量。
“为了让聊天机器人变得更智能,从而对最终用户更有用,它需要持续吸收数据。这个过程被称为‘训练’。问题是,许多[AI](https://www.fastcompany.com/section/artificial-intelligence)公司在抓取网页并将其数据添加到驱动AI聊天机器人的[大型语言模型的语料库](https://www.fastcompany.com/90916291/what-is-a-corpus-ai-corpora-chatgpt)(LLMs)之前,从未明确征求数据所有者的同意。” “但其中一些数据所有者,也就是所谓的内容创作者或知识产权持有者,现在开始反击。他们使用被称为‘tarpits’的工具来实现这一目的。他们的目标是什么?对聊天机器人底层LLM进行投毒,从而降低其输出质量,最终可能导致用户流失。”
查看缓存全文
缓存时间: 2026/05/17 20:24
# 什么是AI陷阱?了解人们用于毒害LLM的工具
来源:https://tech.yahoo.com/ai/articles/ai-tarpits-understanding-tools-people-090000300.html
为了让聊天机器人变得更智能,从而对终端用户更有用,它需要持续吸收数据。这个过程被称为“训练”。问题在于,许多AI公司在抓取网页并将数据添加到驱动AI聊天机器人的大型语言模型(LLM)的语料库之前,从未明确征求数据所有者的同意。
更多来自 Fast Company 的热门文章
但一些数据所有者——也就是内容创作者或知识产权持有者——现在正在反击。他们使用的工具被称为“tarpits”(陷阱)。他们的目标?毒化聊天机器人底层的LLM,从而降低其输出质量,可能导致终端用户流失。以下是你需要了解的内容。
## 什么是AI投毒?
AI投毒是指通过污染AI聊天机器人底层的大型语言模型,使聊天机器人输出错误、误导或完全荒谬的信息。这种污染是通过诱使LLM在训练过程中吸收错误数据实现的——训练通常涉及抓取所有能找到的网页和图片。
根据投毒者想要破坏的LLM的能力不同,投毒的方式也多种多样。
例如,如果有人想毒化一个图像生成LLM,他们可以使用一种名为“Nightshading”(夜影)的技术,该技术使用一个名为Nightshade的软件,在图像上添加一层人眼不可见但对LLM抓取器可见的像素层。这些像素会使AI认为该艺术作品处于与实际不同的风格(例如,抽象风格而非写实风格),从而阻止LLM模仿艺术家的真实风格。
当然,大多数聊天机器人处理的是文本而非图像,这使得像Nightshade这样的投毒工具对未经授权的AI抓取文章和博客内容无效。但在过去几年中,一种新型的AI投毒工具开始流行,其目的是诱使LLM在无用的数据上进行训练。这些工具被称为“tarpits”。
## 什么是AI tarpits?
AI tarpits是一种特定类型的AI投毒工具,旨在诱使LLM使用的抓取器吸收无用的数据。由于LLM随后使用这些垃圾数据生成文本输出,输出结果将是错误的,从而降低AI回复的质量,并最终可能阻止用户使用该聊天机器人。
内容创作者和知识产权持有者可以在其网站上添加多种tarpit陷阱,包括Nepenthes、Iocaine和Quixotic。当LLM抓取器访问一个嵌入了tarpit代码的网站时,抓取器会被重定向去吸收自动生成的、无用的文本——这些文本要么充斥着错误信息(例如,“史蒂夫·乔布斯于1834年创立了微软”),要么完全是胡言乱语(例如,“水的颜色是意大利辣香肠”)。
此外,这些被污染文本的页面会包含指向更多被污染文本页面的链接,而这些页面都没有出口链接。因此,就像现实中的物理陷阱会让动物陷入困境一样,AI tarpit会将LLM抓取器困在无限吸收错误数据的过程中,无法脱离陷阱。
## 普通用户如何保护自己的数据免受AI公司侵犯?
内容创作者和知识产权持有者使用tarpits来浪费AI公司的宝贵资源,并防止LLM在未经同意的情况下吸收网站数据。
但即使你不是内容创作者或知识产权持有者,你也应该知道AI公司正在使用你的数据来训练他们的模型。你每次向AI聊天机器人输入的提示或与它的对话,都会被吸收到该LLM的语料库中,用于进一步分析,目的是让聊天机器人的LLM更加强大。
好消息是,你不必求助于像tarpits这样的专业工具来保护你的数据免受聊天机器人侵犯。相反,你可以明确指示聊天机器人不要在你的数据上进行训练,通过代理使用聊天机器人来隐藏你的身份,或者在上传任何文件给聊天机器人分析之前,使用日常软件工具对你的敏感数据进行编辑。
这篇文章最初发布于fastcompany.com。 *订阅获取 Fast Company 新闻通讯:* http://fastcompany.com/newsletters
相似文章
AI 垃圾内容正在扼杀在线社区
文章认为,在 GitHub 和博客等平台上泛滥的低质量 AI 生成内容(即“AI 垃圾内容”)正在降低在线技术社区的价值。
我找到了对抗AI内容垃圾的方法
作者提出将AI作为研究筛选和综合工具,而非内容生成器,以对抗“AI内容垃圾”。通过构建一个比较并排名专家来源的自动化流程,作者认为未来人类在AI时代的主要角色将是策展人、筛选者和判断者。
为大语言模型辅助的生物威胁创建构建早期预警系统
# 为大语言模型辅助的生物威胁创建构建早期预警系统 来源:[https://openai.com/index/building-an-early-warning-system-for-llm-aided-biological-threat-creation/](https://openai.com/index/building-an-early-warning-system-for-llm-aided-biological-threat-creation/) *注:作为我们*[*预防性框架*](https://openai.com/preparedness/)*的一部分,我们正在投资开发改进的AI赋能型安全风险评估方法。我们相信这些努力*
技能成为新的代码检查工具
作者认为,使用AI技能来自动化代码质量检查,会重现代码检查工具最初旨在解决的内存与可靠性问题,从而质疑基于大语言模型的技能作为替代方案的有效性。
LineageLens
LineageLens 是一个检测 AI 生成内容的工具,可以证明文本是否由 AI 撰写。