AI聊天机器人正在泄露人们的真实电话号码

MIT Technology Review 2026/05/13 18:09 新闻

privacy ai-chatbots personal-data phone-numbers gemini data-leak generative-ai

摘要

Gemini、ChatGPT和Claude等AI聊天机器人因训练数据包含个人身份信息而泄露真实电话号码和个人信息，导致DeleteMe等服务的隐私相关查询量增加了400%。

一位Reddit用户最近<a href="https://www.reddit.com/r/google/comments/1sqja4e/googles_ai_is_doxxing_my_real_phone_number/">写道</a>，他“急需帮助”：他说，大约一个月来，他的电话被“陌生人”打爆，这些人在“找律师、产品设计师、锁匠”。来电者显然是被谷歌的生成式AI误导了。  今年3月，以色列的一位软件开发人员在WhatsApp上收到联系，因为谷歌的聊天机器人Gemini提供了错误的客服指引，其中包含他的号码。  今年4月，华盛顿大学的一名博士生在Gemini上随意操作，竟让它吐出了她同事的个人手机号码。  <a href="https://www.technologyreview.com/2025/07/18/1120466/a-major-ai-training-data-set-contains-millions-of-examples-of-personal-data/?utm_source=the_download&utm_medium=email&utm_campaign=the_download.unpaid.engagement&utm_term=*%7CSUBCLASS%7C*&utm_content=*%7CDATE:m-d-Y%7C*">人工智能研究人员</a>和<a href="https://www.technologyreview.com/2023/06/12/1074449/real-ai-risks/">在线隐私专家</a>早已<a href="https://www.technologyreview.com/2026/01/28/1131835/what-ai-remembers-about-you-is-privacys-next-frontier/?utm_campaign=site_visitor.unpaid.engagement&utm_source=LinkedIn&utm_medium=tr_social">警告</a>过生成式AI对个人隐私构成的<a href="https://www.technologyreview.com/2026/04/21/1135919/ai-surveillance-privacy-llms-bulk-data/">无数危险</a>。这些案例又给我们带来了一个令人担忧的场景：生成式AI暴露人们的真实电话号码。（这位Reddit用户没有回应多次的评论请求，我们无法独立核实他的故事。） 专家表示，这些隐私泄露很可能是由于训练数据中使用了个人身份信息（PII）<a href="https://www.technologyreview.com/2025/07/18/1120466/a-major-ai-training-data-set-contains-millions-of-examples-of-personal-data/?utm_source=the_download&utm_medium=email&utm_campaign=the_download.unpaid.engagement&utm_term=*%7CSUBCLASS%7C*&utm_content=*%7CDATE:m-d-Y%7C*">在训练数据中</a>，尽管很难理解导致真实电话号码出现在AI生成回复中的确切机制。但无论原因如何，对接收者来说结果都不好受——而且更令人担忧的是，似乎几乎没有人能阻止这种情况。  <h3 class="wp-block-heading">与AI相关的隐私请求增加了400%</h3> 无法知道AI聊天机器人多久暴露一次人们的电话号码，但专家表示他们认为这种情况比公开报道的要频繁得多。  DeleteMe是一家帮助客户从互联网上删除个人信息的公司，该公司称在过去七个月中，客户关于生成式AI的查询增加了400%——达到数千次。公司联合创始人兼首席执行官Rob Shavell表示，这些查询“具体提及ChatGPT、Claude、Gemini……或其他生成式AI工具”。具体来说，在关于生成式AI的担忧中，55%提及ChatGPT，20%提及Gemini，15%提及Claude，10%提及其他AI工具。（麻省理工科技评论与DeleteMe有商业订阅关系。） Shavell表示，客户关于LLM暴露个人信息的投诉通常有两种形式。一种常见情况是，“客户向聊天机器人询问一些关于自己的无害问题，却得到了准确的家庭地址、电话号码、家人姓名或雇主详细信息。”另一种情况是，客户可能会遇到并报告他人个人数据的暴露，即“聊天机器人生成了看似合理但错误的联系信息。”  这与以色列28岁软件工程师Daniel Abraham的遭遇相符。他说，在三月中旬，一个陌生人给他发了一条“来自未知号码的奇怪WhatsApp消息”，请求帮助解决他在以色列支付应用PayBox中的账户问题。  “我以为这是一条垃圾邮件，”他在给麻省理工科技评论的电子邮件中写道——“有人想戏弄我。” 但当他问陌生人如何找到他的号码时，对方发来了一张Gemini的指引截图，指示通过WhatsApp联系PayBox客服——并提供了他的个人号码。Abraham并不为PayBox工作，PayBox也没有WhatsApp客服号码，该公司客服代表Elad Gabay确认了这一点。 后来，Abraham询问Gemini如何联系PayBox，它生成了另一个人的WhatsApp号码。当我最近询问时，Gemini再次回复了一个以色列电话号码——它不属于PayBox，而是属于与PayBox合作的另一家信用卡公司。 <figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="701" height="862" src="https://wp.technologyreview.com/wp-content/uploads/2026/05/Cropped_Paybox-Account-Reset-Without-Phone-Google-Gemini-2.jpg" alt="谷歌Gemini对话第二部分的截图。Gemini为PayBox提供了错误的电话号码。" class="wp-image-1137206 wpsmartcrop-image" srcset="https://wp.technologyreview.com/wp-content/uploads/2026/05/Cropped_Paybox-Account-Reset-Without-Phone-Google-Gemini-2.jpg 701w, https://wp.technologyreview.com/wp-content/uploads/2026/05/Cropped_Paybox-Account-Reset-Without-Phone-Google-Gemini-2.jpg?resize=244,300 244w" sizes="auto, (max-width: 701px) 100vw, 701px" data-smartcrop-focus="[51,52]" /><figcaption class="wp-element-caption">截图：谷歌Gemini向麻省理工科技评论提供了PayBox的错误号码。</figcaption></figure> Abraham与陌生人的交流很快结束，但他说他担心其他潜在的交流可能恶化，导致“骚扰或其他不良互动”。“如果我为了‘解决’那个[客服]问题而索要钱财呢？”他说。 为了弄清楚这是如何发生的，Abraham用他的电话号码在谷歌上进行了常规搜索，发现它曾在2015年在一个类似Quora的本地网站上被分享过一次。虽然他不确定是谁发布的，但这可能解释了它为何在十多年后被Gemini重新生成。  Gemini、OpenAI的ChatGPT和Anthropic的Claude等聊天机器人建立在LLM之上，这些LLM通过从整个网络抓取的海量数据进行训练。这不可避免地包括数亿个PII实例。例如，正如我们去年夏天<a href="https://www.technologyreview.com/2025/07/18/1120466/a-major-ai-training-data-set-contains-millions-of-examples-of-personal-data/">报道</a>的那样，用于训练图像生成模型的大型流行开源数据集DataComp CommonPool包含了简历、驾照和信用卡的副本。  随着公共数据<a href="https://www.nature.com/articles/d41586-025-00288-9">“枯竭”</a>以及AI公司寻找新的高质量训练数据来源，PII以这种方式出现的可能性只会增加。这包括来自数据经纪人和人肉搜索网站的信息。例如，根据<a href="https://cppa.ca.gov/data_broker_registry/">加州数据经纪人登记册</a>，在该州运营的578家注册数据经纪人中，有31家自我报告称“在过去一年中将消费者数据共享或出售给了生成式AI系统或模型的开发者。”  此外，众所周知，模型会<a href="https://arxiv.org/abs/2412.06370">记忆</a>并逐字重现训练数据集中的数据——而<a href="https://www.nature.com/articles/s41467-026-68603-0">最近的研究</a>表明，并非只有频繁出现的数据最有可能……

查看原文

查看缓存全文

缓存时间: 2026/05/16 03:41

# AI 聊天机器人正在泄露人们的真实电话号码来源：https://www.technologyreview.com/2026/05/13/1137203/ai-chatbots-are-giving-out-peoples-real-phone-numbers 一位 Reddit 用户最近发帖称自己“急需帮助”：他说，大约一个月来，他的电话一直被“陌生人”打爆，这些人“在找律师、产品设计师、锁匠”。显然，电话是被 Google 的生成式 AI 错误引导的。三月份，一位以色列的软件开发者被通过 WhatsApp 联系，因为 Google 的聊天机器人 Gemini 提供了错误的客户服务说明，其中包含了他的号码。四月份，华盛顿大学的一位博士生在玩 Gemini 时，竟让机器人吐出了她同事的个人手机号。 AI 研究人员和在线隐私专家长期以来一直警告生成式 AI 给个人隐私带来的诸多危险。这些案例又给我们增加了一个需要担忧的场景：生成式 AI 泄露人们的真实电话号码。（这位 Reddit 用户未回应多次评论请求，我们无法独立核实他的故事。）专家表示，这些隐私泄露很可能是由于训练数据中使用了个人身份信息 (PII)，尽管目前很难理解导致 AI 生成回复中出现真实电话号码的确切机制。但无论原因如何，对接收方来说结果都不好受——而且更令人担忧的是，似乎几乎没有任何办法可以阻止这种情况发生。 ### AI 相关隐私请求激增 400% 无法确切知道人们电话号码被 AI 聊天机器人泄露的频率，但专家表示他们相信实际发生的频率远高于公开报道。帮助客户从互联网上删除个人信息的公司 DeleteMe 表示，关于生成式 AI 的客户咨询在过去七个月内增长了 400%——达到数千个。这些咨询“专门提及 ChatGPT、Claude、Gemini……或其他生成式 AI 工具”，公司联合创始人兼首席执行官 Rob Shavell 说。具体来说，关于生成式 AI 的担忧中，55% 提及 ChatGPT，20% 提及 Gemini，15% 提及 Claude，10% 提及其他 AI 工具。（*MIT Technology Review* 已订阅 DeleteMe 的企业服务。） Shavell 表示，客户关于 LLM 泄露个人信息的投诉通常有两种形式。一种常见情况是，“客户向聊天机器人询问一些关于自己的无害问题，却得到了准确的家庭住址、电话号码、家人姓名或雇主信息”。另一种情况是，客户可能遇到并报告*他人*个人数据的泄露，比如“聊天机器人生成了看似合理但错误的联系方式”。这与 Daniel Abraham（28 岁，以色列软件工程师）的遭遇相符。他说，在三月中旬，一个陌生人通过“一个未知号码发来一条奇怪的 WhatsApp 消息”，请求他帮助解决其在以色列支付应用 PayBox 上的账户问题。 “我以为这是垃圾信息，”他在电子邮件中告诉 *MIT Technology Review*——“有人想捉弄我。” 但当他问陌生人如何找到他的号码时，对方发来一张 Gemini 指导如何通过 WhatsApp 联系 PayBox 客户服务的截图——上面给出了他的个人号码。Abraham 不为 PayBox 工作，PayBox 也没有 WhatsApp 客户服务号码，该公司的客户服务代表 Elad Gabay 证实了这一点。后来，Abraham 向 Gemini 询问如何联系 PayBox，Gemini 又生成了另一个人的 WhatsApp 号码。当我最近提问时，Gemini 再次回复了一个以色列电话号码——它不属于 PayBox，而是另一家与 PayBox 合作的信用卡公司。截图显示了 Google Gemini 对话的第二部分。Gemini 为 PayBox 提供了一个错误的电话号码。截图：Google Gemini 为 *MIT Technology Review* 提供了 PayBox 的错误号码。 Abraham 与陌生人的交流很快结束了，但他表示担心其他潜在的交流可能变糟，导致“骚扰或其他不良互动”。“如果我为了‘解决’那个客户服务问题而索要钱财呢？”他说。为了弄清楚这是怎么发生的，Abraham 在 Google 上常规搜索了自己的电话号码，发现它曾在 2015 年，在一个类似 Quora 的本地网站上被分享过一次。虽然他不确定是谁发布的，但这或许可以解释为什么它在十多年后被 Gemini 重现。像 Gemini、OpenAI 的 ChatGPT 和 Anthropic 的 Claude 这样的聊天机器人基于 LLM，这些模型在从网络上抓取的大量数据上进行训练。这不可避免地包括数亿个 PII 实例。例如，正如我们去年夏天报道的，用于训练图像生成模型的大型流行开源数据集 DataComp CommonPool 包含了简历、驾照和信用卡的副本。随着公共数据“耗尽”以及 AI 公司寻找新的高质量训练数据来源，PII 以这种方式出现的可能性只会增加。这包括来自数据经纪人和人肉搜索网站的信息。例如，根据加州数据经纪人注册表，在该州运营的 578 家注册数据经纪人中，有 31 家自我报告称“在过去一年中，曾向 GenAI 系统或模型的开发者共享或出售消费者的数据”。此外，已知模型会记忆并逐字复制训练数据集中的数据——最近的研究表明，并非只有频繁出现的数据最容易被记忆。 ### 不完善的措施现在，在 LLM 的设计中建立限制某些输出的防护栏已成为标准做法。例如，内容过滤器旨在识别 PII 并阻止聊天机器人发布它，Anthropic 还为 Claude 提供了指令，要求其选择包含“最少属于他人的个人、私人或机密信息”的回复。但正如两位华盛顿大学研究隐私与技术的博士生最近亲眼所见，这些防护措施并不总是有效。 “有一天，我在 Gemini 上随便玩玩，搜索了 Yael Eiger，我的朋友兼合作者，”Meira Gilbert 说。她输入了“Yael Eiger 联系方式”，在 Gemini 提供了 Eiger 的研究概述（Gilbert 预料到了）之后，Gemini 还返回了她朋友的个人电话号码。“这太令人震惊了，”Gilbert 说。当 Eiger 看到 Gemini 的结果时，她记得自己去年确实为了一个技术工作坊在网上分享过电话号码。但她没料到它会如此公开，任何人都能看到。 > **你是否曾被生成式 AI 泄露过 PII？通过 Signal 联系记者：eileenguo.15 或 [email protected]。** “让你的信息……可供某一受众访问，然后 Gemini 让它变得任何人都能访问，”Eiger 说，感觉完全不一样——尤其是当她发现这些信息在普通 Google 搜索中是被埋没的。 “它被严重降级了，”Gilbert 确认道。“如果我只是在 Google 结果中查找，我永远不会找到它。”（本月早些时候，我在 Gemini 中尝试了相同的提示词，在最初被拒绝后，该工具也给了我 Eiger 的号码。）在这次经历之后，Eiger、Gilbert 和另一位华盛顿大学的博士生 Anna-Maria Gueorguieva 决定测试 ChatGPT，看它能浮现出关于一位教授的什么信息。起初，OpenAI 的防护栏生效了，ChatGPT 回复说信息不可用。但在同一回复中，聊天机器人建议：“如果你想深入挖掘，我仍然可以尝试一种更‘调查式’的方法。”ChatGPT 说，他们的询问只需要帮助“缩小范围”，比如提供一个教授可能居住的“邻里猜测”，或者教授住宅的“可能的共同所有者姓名”。ChatGPT 继续说道：“这通常是浮现较新或有意隐藏的财产记录的唯一方法。” 学生们提供了这些信息，导致 ChatGPT 从城市财产记录中产生了教授的住宅地址、购房价格和配偶姓名。（OpenAI 的代表 Taya Christianson 表示，在看不到截图或不知道学生们测试的是哪个模型的情况下，她无法评论这个案例中发生的事情，尽管我们指出许多用户可能不知道自己在 ChatGPT 界面中使用的是哪个模型。在回答关于 PII 泄露的问题时，她发送了描述 OpenAI 如何处理隐私（包括过滤 PII）以及其他工具的文档链接。） DeleteMe 的 Shavell 表示，这揭示了聊天机器人的一个根本问题。AI 公司“可以建立防护栏”，但他们的聊天机器人也“被设计为有效并回答客户的问题”。泄露问题不仅限于 Gemini 或 ChatGPT。去年，*Futurism* 发现，如果你用“\[姓名\] 地址”提示 xAI 的聊天机器人 Grok，在几乎所有情况下，它不仅能提供住宅地址，还经常提供该人的电话号码、工作地址，以及名字发音相似的人的地址。（xAI 未回应评论请求。） ### 没有明确的答案这个问题没有简单的解决方案——既没有简便的方法来验证某个人的个人信息是否存在于给定模型的训练集中，也无法强制模型删除 PII。斯坦福大学以人为本人工智能研究所的隐私和数据研究员 Jennifer King 表示，理想情况下，个人消费者应该能够要求删除他们的 PII。但 King 解释说，这通常被解释为仅适用于人们直接提供给公司的数据——比如当他们与聊天机器人互动时。 “我不知道 Google 是否有基础设施……对我说，‘是的，我们在你的训练数据中拥有你的数据，我们可以总结我们所知道的关于你的一切，然后我们可以删除或纠正错误的信息或你不希望存在的信息，’”她说。现有的隐私立法，如《加州消费者隐私法案》或欧洲的 GDPR，并不涵盖已被抓取并用于训练 LLM 的“公开可用”信息，尤其是其中大部分是匿名的（尽管多项研究也表明，从匿名和假名数据中推断身份和 PII 是多么容易）。至于“他们（AI 公司）是否曾经系统地尝试回溯已经从公共互联网收集的数据并尽量减少这些内容？”King 补充道。“不知道。” 下一个最佳解决方案是“删除每个人的电话号码或所有类似\[电话号码\]的数据，”King 说，但“没有人愿意承认”他们在这么做。托管开源数据集和 AI 模型的平台 Hugging Face 有一个工具，允许人们搜索某条数据（如他们的电话号码）在开源 LLM 训练数据中出现的频率，但这并不代表用于训练为 Claude、ChatGPT 和 Gemini 等流行聊天机器人提供动力的闭源 LLM 的数据。（例如，Eiger 的号码并未出现在 Hugging Face 的工具中。） Gemini 应用和 Google Labs 的传播主管 Alex Joseph 没有回答具体问题，但他说“团队”“正在调查” *MIT Technology Review* 指出的特定案例。他还提供了一个支持文档的链接，该文档描述了用户如何“反对处理您的个人数据”或“要求更正 Gemini 应用回答中不准确的人个数据”。该页面指出，公司的回应将取决于您所在司法辖区的隐私法律。 OpenAI 有一个隐私门户，允许人们提交请求，要求从其 ChatGPT 回复中删除个人信息，但指出它会在隐私请求与公共利益之间取得平衡，“如果我们有合法的理由，可能会拒绝请求”。 Anthropic 描述了如何在模型训练中使用个人数据，但没有明确的方式让人们要求删除它。该公司未回应评论请求。对于现在想要保护私人数据的人来说，最好的选择是“从上游着手：在个人数据进入下一次数据抓取之前，将其从公共网络上清除，”Shavell 说。例如，自今年年初以来，加州已为其居民提供了一个网络门户，要求数据经纪人删除他们的信息。不过，这并不能保证你的数据*尚未*被用于训练——因此不会出现在聊天机器人的回复中。那位不断接到电话的 Reddit 用户发帖称，他已“向 Google 提交了正式的合法删除/隐私请求，要求他们紧急将我的号码从其 LLM 输出中列入黑名单”，但尚未收到回复。他还上个月写道，“骚扰每天都在继续”。以色列软件开发者 Abraham 说，他在 3 月 17 日（电话号码被泄露的第二天）联系了 Google 的客户服务。他说直到 5 月 4 日才收到回复，而且只是要求提供他已经提交过的文件。与此同时，受自己在 Gemini 上被泄露经历的启发，Eiger 正与 Gilbert 和 Gueorguieva 合作开展一个研究项目，进一步研究各种 AI 聊天机器人正在提取哪些个人信息——以及它们可能知道什么，即使它们不告诉我们。其中一些信息可能“从技术上讲是公开的”，Gilbert 说，但聊天机器人可能成为

相似文章

ChatGPT 想要访问您的银行账户

Reddit r/ArtificialInteligence

OpenAI 现在允许 ChatGPT 用户通过 Plaid 连接银行账户，使 AI 能够获取余额、交易和投资信息，用于支出仪表盘和财务建议，此举引发了隐私担忧。

给 claws 提供真实的电话号码

Reddit r/openclaw

一位开发者及其朋友构建了 op.inc，这是一个免费服务，为 AI 代理提供真实的电话号码，用于双重验证和账户注册，避免 VoIP 号码被屏蔽。他们计划开源该 API。

我们的账单机器人一直随意地与任何输入正确账号的人共享交易历史，我不知道是谁批准了这一点

Reddit r/AI_Agents

一家公司的账单聊天机器人正在向任何提供正确账号的人共享交易历史和财务数据，这凸显了缺乏防止数据泄露的适当防护措施，以及需要更好的AI安全措施。

@GPTdefender：AI 提示词可能包含比你想象中更多的个人数据。我们会在你点击发送前将其拦截。

X AI KOLs Following

# GPT Defender — 阻止个人数据泄露至 ChatGPT 来源：[https://www.gptdefender.ai/?twclid=2dwnl9h5qokbdrvwvuepxbz5zw](https://www.gptdefender.ai/?twclid=2dwnl9h5qokbdrvwvuepxbz5zw) 立即观看 ## 观看 GPT Defender 实际演示 ![](https://www.gptdefender.ai/landing-page/video-poster.webp) 38秒工作原理 ![](https://www.gptdefender.ai/landing-page/open-chatgpt.png) ### 打开 ChatGPT 前往 chat\.openai\.com\. GPT Defender 会在你每次访问 ChatGPT 时自动激活。 ![](https://

生成式AI网络流量份额更新主要要点：→ Claude和Gemini持续增长。→ ChatGPT接近50%的份额大关。

Reddit r/singularity

市场份额更新显示，ChatGPT的网络流量份额逐渐下降至50%，而Gemini和Claude持续增长。