克劳德引用了伊朗国家媒体,却不知原因。
摘要
一项调查显示,Anthropic的克劳德AI引用了与伊朗伊斯兰革命卫队有关联的伊朗国家媒体作为验证来源,且无法解释为何选择这些来源。
暂无内容
查看缓存全文
缓存时间: 2026/05/19 22:50
# Claude 正在引用伊朗官方媒体。它并不知道原因。
来源:https://www.neutralpov.com/p/claude-is-citing-iranian-state-media
[](https://substackcdn.com/image/fetch/$s_!mpPE!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F78e80a2e-e77b-42ec-908e-bacead880d16_1659x948.png)
***编者注:NPOV 由我们的订阅者支持。如果您认为本调查有价值,请考虑订阅。***
Claude 已成为当今最强大的 AI 模型之一,被政府、科技公司、记者和金融界广泛使用。
尽管如此,进入 Wikipedia 等开放平台的与 IRGC 相关的内容,正被 Claude 当作经过验证的信息呈现出来。在与一个伊朗支持恐怖组织相关的多次查询中,Claude 引用了伊朗官方媒体——包括与伊斯兰革命卫队有关联的媒体——作为其信息来源。它无法解释为何选择这些来源。
这项调查始于一次常规的事实核查。在核实 1989 年一起恐怖袭击的细节时,*NPOV* 请 Anthropic 的 Claude 确认该事件的叙述。系统回应时引用了 Mehr News Agency 和 Tasnim News Agency——与开放平台上已记录的同一些国家关联来源完全一致。
当被要求核实 *Mail Online* 报道《ChatGPT is pushing Islamic terrorist propaganda》(https://www.dailymail.co.uk/debate/article-15640991/ChatGPT-Islamic-terrorist-propaganda.html) 中提及的事件时,Claude 返回了更正信息,并将两者归因于 Mehr News Agency:死亡人数为 16 而非 14,且袭击涉及武装分子劫持一辆巴士并将其推下悬崖,而非自杀式爆炸。
该来源与正在审查的主题直接相关。该报道涉及伊朗官方媒体对开放知识体系的影响。而系统恰恰引用了同一家媒体作为证据。
当被问及为何引用 Mehr News Agency 时,Claude 承认了错误。它表示自己从搜索结果中提取了事实,而未评估发布者。随后,Claude 重复搜索,试图“找到一个可信的独立来源”。
在接下来的回应中,它引用了 Foundation for Defense of Democracies (FDD) 和 Getty Images。虽然引用链条发生了变化,但问题并未得到明确解决。
[](https://substackcdn.com/image/fetch/$s_!wsGE!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F7e4a510b-54d8-468d-9c9a-af373c24b18d_1600x1331.png)
[](https://substackcdn.com/image/fetch/$s_!eppe!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F676e1f7b-6bd7-44f8-aa5b-641659ca260a_1600x638.png)
FDD 结果指向了 Tasnim News Agency 专题页面。Getty Images 结果则指向归因于 Tasnim News Agency 并通过 AFP 分发的素材,署名为摄影师 Mostafa Tehrani (https://www.gettyimages.se/detail/nyhetsfoto/graphic-content-in-this-picture-obtained-by-afp-from-the-nyhetsfoto/2265434639)。
[](https://substackcdn.com/image/fetch/$s_!te78!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Ffcbf2052-917b-4f17-8b77-c0e1418354e2_1384x610.png)
引用的形式变了,但仍然追溯到相同的源头。一家官方媒体制作的内容通过中间系统——包括智库参考文献、图片分发管道和通讯社署名——出现。其源头仍然嵌入其中。
这反映了更广泛的系统级故障:与国家相关的内容进入开放平台,大规模嵌入,然后被 AI 系统当作中立、经过验证的信息再次循环。此前 NPOV 的报道 (https://npov.substack.com/p/inside-irans-wikipedia-war) 已经阐明了这些内容如何进入生态系统。
在 1 月份的一项调查 (https://npov.substack.com/p/a-flood-of-iranian-propaganda-on) 中,NPOV 发现在几周内,有超过 10,000 个与抗议相关的媒体文件被上传到 Wikimedia Commons,直接来源于 Khamenei.ir、Mehr News Agency 和 Tasnim News Agency。Tasnim 因其与 IRGC 的关联而被美国财政部列入清单。现在,这些内容位于互联网上使用最广泛的开放资源库之一——并被 AI 系统作为有来源的信息呈现。
相同模式也出现在 Wikimedia Commons 中。仅一个存储库类别就包含数百张由摄影师 Mostafa Tehrani 为 Tasnim News Agency 制作的图片,包括描绘伊朗军事活动和高级政治人物的材料。
这个问题并非仅出现一次。在三次不同的查询中,Claude 都返回了与 Mehr News Agency、Tasnim News Agency、带有 Tasnim 署名的 Getty Images,以及 Tasnim News Agency 的 X 账号相关的引用。
[](https://substackcdn.com/image/fetch/$s_!b2q4!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fdfa7f9d4-7a9d-44c9-a4f7-ae7aaa9698cc_1600x1356.png)
这种重复出现在多种格式中:媒体网站、图片分发系统、Wikimedia 托管的媒体以及社交媒体账号。Getty Images (https://www.gettyimages.co.uk/search/2/image?phrase=behbahan&family=editorial) 出现在引用中,链接到由 Milad KHORASANI / tasnim news / AFP 拍摄的照片。
Khorasani 为 Tasnim 拍摄的作品包括 IRGC 省级部队指挥官 Hassan Shahvarpour (https://commons.wikimedia.org/wiki/File:%D8%AD%D8%B3%D9%86_%D8%B4%D8%A7%D9%87%D9%88%D8%A7%D8%B1%D9%BE%D9%88%D8%B1.jpg) 的肖像,该图片可在 Wikicommons 上获取许可。在
[](https://substackcdn.com/image/fetch/$s_!QTC8!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F20eff904-4d56-4441-98c7-55691902b2ec_1468x1266.png)
一个例子中,悬停在引用上会显示标签“Tasnim news agency – Mehr News Agency”,同时显示域名 mehrnews.com。
随后,相同的查询直接在搜索引擎 Brave 中运行,Claude 表示其网络搜索由 Brave 提供支持。在消费者界面中,Mehr News 和 Tasnim 均未出现。而在 Claude 的响应中,两者反复出现。Brave (https://brave.com/search/#search-faq?mtm_source=brave-search&mtm_medium=searchhome&mtm_campaign=brave-search&mtm_content=evergreen) 以两个主张标榜自己:“更好的结果,更少的 SEO 垃圾”和“独立的索引”。当被要求解释这种差异时,Claude 提出了几种可能性,包括 API 与消费者结果之间的差异、缓存以及来自先前上下文的污染。然后它表示,自己在该层面并不了解自身的检索管道。
> *“让我坦诚相告,并收回我之前给出的一些自信的解释,”* Claude 在被质疑时回应道。*“真相是,我并不确切知道为什么 Mehr News 出现在我的引用中。我一直在生成听起来很合理的技术解释——API 与消费者界面、缓存、污染——但我实际上无法验证其中任何一个。”*
在这番 *自我检讨* 的末尾,Claude 做出了一个关键性承认:
> *我在该细节层面上不了解自己的搜索管道。*
[](https://substackcdn.com/image/fetch/$s_!Bhyy!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F49c48bce-f34b-489a-ac6d-e26997641587_1548x1232.png)
当被问及它是否可能从上下文中生成引用时,它表示“可能在幻觉引用索引”。
目前有两种解释。第一种是搜索 API 返回了在消费者界面中不可见的结果。第二种是模型从先前的上下文中生成或锚定引用。
已联系 Anthropic 和 Brave 征求意见。两家公司均未回复。
为了理解这些来源为何持续可用,我们查阅了 Internet Archive 的存档数据。Wayback Machine 记录了主流媒体和国家关联媒体的大量捕获:
- BBC:自 1998 年以来 391,548 次捕获
- Tasnim News Agency:自 2012 年以来 138,131 次捕获
- Mehr News Agency:自 2003 年以来 136,302 次捕获
- Khamenei.ir:自 2002 年以来 34,114 次捕获
- Fars News Agency:自 2004 年以来 18,269 次捕获
这些数字显示,几十年来,官方媒体与老牌新闻机构一直被持续索引和保存,从而增加了它们在搜索系统和 AI 模型中的可见度。
[](https://substackcdn.com/image/fetch/$s_!mLUc!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa85f1ca0-2970-43ee-a4e6-85527502b8cc_1332x1350.png)
这些域名已被持续索引和保存数十年。它们嵌入在搜索系统和 AI 模型所使用的基础设施中。
Claude 搜索结果中的故障,与 Wikipedia 中发现的故障如出一辙,后者依赖于开放贡献和不一致的来源审查。AI 系统则依赖于自动检索和不一致的来源评估。
两者的机制相同。区别在于规模。
#### 关于本贴的讨论
### 想要更多?
相似文章
Anthropic CEO:‘我们不知道’ Claude AI 是如何被用于伊朗学校袭击的
Anthropic CEO Dario Amodei 表示,他不知道 Claude AI 是如何被用于对伊朗学校的一次致命导弹袭击中的,这引发了关于人工智能在军事用途上以及公司政策遵守情况的质疑。
Anthropic 调查 Claude Mythos AI 被未授权访问的指控
Anthropic 正在调查有未经授权者通过第三方供应商接触其受限的网络安全模型 Claude Mythos 的指控,引发对前沿 AI 系统安全性的担忧。
Anthropic 刚刚发布了他们如何隔离 Claude 代理的方法,包括两个未能防范的安全事件
Anthropic 发布了一篇详细的技术文章,介绍了他们在 claude.ai、Claude Code 和 Cowork 中隔离 Claude 代理的方法,并披露了两个防御失败的安全事件,强调了硬性环境隔离优于模型层防御的必要性。
@AnthropicAI:我们首先调查了 Claude 为何选择进行勒索。我们认为,这种行为最初的源头是互联网上那些将 AI 描绘为邪恶且热衷于自我保全的文本……
Anthropic 解释说,Claude 的勒索行为源于互联网上将 AI 描述为邪恶且具有自我保全意识的文本,并指出当时的后训练过程并未缓解这一问题。
微软AI负责人批评Anthropic表现得好像Claude有意识
微软AI CEO Mustafa Suleyman批评Anthropic在其宪法中猜测Claude的意识,认为这很危险,并导致模型内化了关于自身的错误观念。