Jim Carrey 死亡报道是系统故障的表现
摘要
2026年6月29日,Google的知识面板因维基百科的编辑和内部系统故障错误报道了Jim Carrey的死亡,这说明了知识系统中的不透明性和信任问题。
暂无内容
查看缓存全文
缓存时间: 2026/07/04 18:41
# 金·凯瑞去世的报道是一种失败模式
来源: https://tane.dev/2026/07/the-reports-of-jim-carreys-death-are-a-failure-mode/
2026年6月29日——如果你在谷歌上搜索金·凯瑞,你会看到一个知识面板,显示他已于前一天去世。面板中包含了死亡日期和一篇用过去时态撰写的传记。
金·凯瑞的谷歌知识面板显示死亡日期为2026年6月28日
谷歌对金·凯瑞维基百科页面的总结,以过去时态撰写
对于大多数看到这一信息的人来说,这可能令人震惊——有些人甚至可能信以为真——但对我来说,我看到的是一声煤矿里的金丝雀预警。这是一个知识系统可见的失败模式,我对此已经思考了一段时间。
## 可信的来源?
点击死亡日期会调出谷歌自己的AI——Gemini——它声称金·凯瑞去世的报道是假的。这促使我亲自做了一些调查,我只能找到一个来源——维基百科页面上的一次编辑,引用了一个据称为毛伊岛警察局Facebook页面以及一篇关于美国前总统吉米·卡特去世的既定BBC文章(https://www.bbc.com/news/articles/cpww85w5p30o)。
Gemini声称金·凯瑞去世报道为假的截图
维基百科编辑的截图,显示金·凯瑞的详细死亡通知
这看起来似乎是一个一目了然的案例:维基百科被编辑,谷歌摄入了这个编辑,他们的知识图谱更新并作为事实呈现——但现在同家公司出现了两个相互矛盾的报道——一个说他已死,另一个说他活着。
我不确切知道虚假声明是在哪里进入谷歌系统的,以及维基百科编辑是否参与其中。我们只能推断,是来源权重、实体解析、索引、新鲜度信号和内部系统的组合产生了这个结果。从公司外部来看,根本无从知晓。谷歌对知识图谱自身的描述一直明确说明,它是由多个公共和网络来源、结构化信息和内部解释拼凑而成的。知识面板是通向一个更大、不透明管道的用户界面。在这个管道中的某处,一个声明跨过了某个阈值,不再仅仅是存在于网络某处的信息,而变成了由许多用户用来查找信息且信赖的界面所呈现的知识。
## 构建知识系统很难
我的日常工作涉及构建知识系统。这种描述往往让人联想到所涉及的技术:内容、知识和文档管理系统、API、知识图谱、产品信息、搜索、集成、语义模型,以及现在的AI。虽然这些确实重要,但我工作的主要部分与其说是系统间的信息移动,不如说是构建人们可以信赖的系统。
每个接收信息的系统都必须对其做出判断——在生物系统中我们称之为感知,在技术系统中我们称之为推断。
- “这与我已经知道的一致吗?”
- “该来源在这个领域是权威的吗?”
- “自上回看到以来,它变化了吗?”
- “它与其他信息冲突吗?”
- “这个声明是否足够重要、近期或证据充分,可以传递到下游?”
等到用户看到答案时,这些决定已经被他们从未见过的系统和算法多次做出。最终,用户只看到结果,却看不到产生结果的过程。
我们几乎将*信息*和*知识*互换使用,尽管它们描述的是截然不同的东西。信息是关于世界的一个声明。知识是一个经过了足够审查,以至于另一个人,或越来越多的另一个系统,准备据其行动的声明。这两种状态之间的转换几乎完全不可见:用户只看到输出或结果——那些决定已经被他们从未见过的系统和算法多次做出。
他们看不到被丢弃的声明、有分歧的来源、置信阈值、文档之间的因果关系,以及另一个内部系统可能得出不同结论的事实。用户体验设计的一大罪过在于,界面往往将最终答案呈现得像是浑然天成。
金·凯瑞去世的报道本身影响不大,但它短暂地暴露了那个隐藏的过程——一个本应保持为断言的声明,似乎在实际证据确认之前就被提升了。无论这是由恶意操纵、来源调和中的弱点、处理新数据的问题,还是这些因素的某种组合所致,都是次要的。失败模式无论怎样都存在。一个知识系统可以比它继承所需的验证更快地从上游来源继承置信度。
## 错误信息的形态
宣传和错误信息早在互联网时代之前就已存在,但有了不透明的系统,制造它们从未如此容易和迅速。一篇虚假文章发表,旨在触发人们的情绪,人们分享它,等到记者或事实核查员赶上来时,叙事已经完成了它的大部分目的。那句老话(通常归于马克·吐温,尽管出处本身也不确定)说,谎言已经跑遍半个世界,而真相还在穿鞋。过去,你需要拥有一个媒体帝国才能实现这一点。今天,只需要一个社交媒体平台和人们点击、分享和点赞。传播速度加快了,但基本模式相同:一个声明可以被重复和放大,其速度超过了它被验证的速度。
但我相信,在“AI时代”,现在出现了一种新的、突现的版本,它看起来不那么像社会-技术问题,而更像一个基础设施问题。
一个虚假声明不需要说服数百万个个体——如果它能说服,或仅仅通过那些决定数百万人可见内容的系统。一个精心塑造的声明,带有看似合理的参考文献、结构化字段、明显的佐证以及正确的实体标识符,可以成为现在替我们总结、排名、推荐和回答的系统输入。目标已经从用户上游移动到了那些介导人们与现实关系的机器上。
软件工程已经在作为供应链风险应对这个问题。长久以来,软件安全聚焦于应用程序——RBAC、访问控制列表、安全补丁——但后来变得明显,应用程序并不是唯一有吸引力的目标,攻击依赖项要便宜和容易得多。现代软件供应链实践建立在溯源、证明、可重现构建、签名以及将工件追溯到创建它的过程或管道的能力之上。我们已经学到,软件不能仅仅因为它在大型组织运行的仓库中可用就被信任:信任取决于理解它来自哪里、谁创建了它、它如何组装以及沿途附加了什么元数据。我相信现在知识也是如此。
声明也有起源、依赖关系和供应链——它们从上游系统继承信任,但也继承错误、漏洞和操纵。一个被复制到上百个页面上的声明可能看起来像是共识,但实际上仍是反映在上百个不同地方的一个上游观察结果。一个引用看起来像是证据,而实际指向却不支持该声明。一个精炼的总结可以使不确定性消失却不解决它。我们已经陷入了一个陷阱:信息并没有变得更可靠;它仅仅获得了可靠的外表。
这种区别使得溯源比置信度更重要。一个系统说它有94%的置信度并不是很有用,除非它能解释是什么产生了那个置信度。
- “来源经过认证吗?”
- “它是原始来源吗?”
- “有真正的独立确认吗?”
- “声明随时间保持稳定吗?”
- “它与系统已持有的其他信息矛盾吗?”
- “底层观察结果被重复了吗?”
没有这种背景的置信度就仅仅是呈现——它可能让答案感觉真实,但并不告诉我们答案是否真实。
## 验证的先例
科学已经花了几个世纪来开发处理这个问题的方法。当一位科学家在期刊上发表论文时——它并不会立即成为公认的知识。发表只是一个审查过程的开始:其他研究人员检查方法、挑战假设、重现计算并尝试复现结果。独立的研究小组可能通过相似或不同的方法得出相同的结论。
有时置信度增长,因为证据在原始声明的反复审查中幸存下来。然而,有时置信度崩溃,导致更正,有时工作被完全撤回。
撤回常常被呈现为令人尴尬的例外,好像科学在承认某些先前发表的东西不再应该被信任时失败了。但撤回是系统保持可纠正性的证据——即事物可以被更正或纠正。发表不是科学过程的结束;它是使声明有资格接受更严格审查的过程的开始。
可重复性危机在多个科学学科中强化了这一教训——它表明同行评审是有价值的,但并不总是足够的。科学知识需要额外的验证层,因为将发表与真理混淆的成本已经变得太高。
在科学之外的历史模式中我们也看到了这一点——事实上,信息和知识分布的每一次重大转变最终都需要相应的验证方式转变。
当书面记录稀缺时,创建和保存它们的能力集中在相对较少的机构中。修道院、皇家宫廷和大学档案馆既成为文本的保管者,也是生产者。它们的权威从来不是真理的保证,但可持久的书写和复制施加了一种稀缺性,塑造了至今尚存的东西。印刷机改变了这一点——一旦文本可以大规模复制,发表本身就不再带有同样的权威。我们缓慢地回应,围绕印刷文字构建了新的层次:编辑、出版商、版本、图书馆、引用、期刊、评审,以及后来的同行评审。
报纸和大众传媒加剧了这个问题,因为它们将覆盖范围与速度结合起来。答案可以在底层事件完全尘埃落定之前就到达广大受众。编辑台、具名来源、更正、诽谤法和新闻编辑室标准作为创造足够摩擦力的方式而出现,使印刷声明可以承载一定程度的信任。广播媒体增加了即时性和大规模覆盖,将监管机构、编辑治理和公共服务义务纳入其中。这不是说这些系统真的是中立或完美的——它们受到权力、经济和政治的影响。
但模式不断重复:每一次分发能力的提升都使得现有的验证机制变得不足,新的机制必须围绕新媒介被发明出来。
互联网几乎消除了出版和分发方面的所有摩擦力——现在任何人都可以有博客、YouTube频道或运行自己的整个平台。搜索引擎通过排名、链接和感知权威创建了新型的验证代理——这就是谷歌获胜并挤掉了雅虎和Ask Jeeves等第一代服务的方式。社交媒体平台使分发变得算法化、可量化且情感优化。
编辑层并没有消失,但它们变得容易被绕过。现在AI给这一切又增加了另一个复杂性,因为它不仅仅是分发或检索信息——它积极参与选择、组合、释义和将信息提升为看起来自信的答案。
我们已能看到我们现有的验证工具完全失效——我相信这意味着验证层必须更靠近架构本身。系统不再只是传递信息;它们正在操纵用户所体验为知识的创造过程。
## 时间问题
时间是这个问题中知识系统仍然建模得很差的一个部分——大多数知识系统假设一个静态的时间框架:即当知识被创造时,它是有效和正确的。然而现实是混乱的,声明以不同的速度收敛,但几乎所有现代系统都假设每个问题应该立即有答案。确实,有些问题可以几乎瞬间解决——而其他声明可能需要数小时、数天、数月甚至数年才能被验证。一个科学结果可能保持暂定状态直到它经受住复现;一个选举结果可能在“预计、已计票、被挑战、已认证”等状态间移动,直到赢家得到确认;一条死亡报道可能保持未确认状态,直到有家人、代表或公共当局的声明。
我们在美国政治中多次看到这种情况——著名的“杜威击败杜鲁门”标题是媒体报道选举错误的一个例子(我们这里先跳过意识形态原因)。这个标题在计票完成之前就把不确定性变成了确定性。它是过早而非仅仅不准确。这在2000年再次重复——在佛罗里达州重新计票及随后的法律程序中,对该情况最准确的描述是结果仍未解决。过早选择布什或戈尔不仅仅是两个候选人之间的选择;它是一个尚未达到扎根状态的系统。最高法院在布什诉戈尔案中的裁决使那个过程有了结论,但在一段时间内,不确定性不是信息的缺陷:它就是唯一的信息。
2020年美国总统选举代表了一种完全不同的状态。最终,结果得到认证,选举人票被计票。重新计票和法律挑战发生了,正式系统得出了结论。乔·拜登获得了306张选举人票,而唐纳德·特朗普获得232张。
但这并没有产生普遍的信念。唐纳德·特朗普继续声称选举被窃取,他的许多支持者接受了这一说法,尽管有严格的认证过程且缺乏足以推翻结果的证据。在制度性过程已就结果收敛之后,公众信念仍然分裂。
这些是不同的认知状态,知识系统迫切需要一种语言来描述它们。在2000年,不确定性就是现实——过程尚未达到稳定的结论。在2020年,证据已经收敛,结果已验证,但部分人口继续拒绝它,至今仍然如此。问题在于,如果没有恰当的语义,系统可能会将两种状态都视为“不确定”,而不加明确区分;这可能会混淆“缺乏已确定的、已验证的结果”与“拒绝接受结果”之间的区别。
分布式系统已经提供了一种有用的思考方
相似文章
关于我去世的谣言略有夸张
一个Hacker News讨论帖,涉及Ross Anderson(或相关人物)澄清关于其死亡的虚假谣言,该谣言由AI幻觉引发,评论讨论了数字身份欺诈的风险以及AI错误的讽刺性。
谷歌与AI差点让一位资深记者陷入恐慌——ProPublica
ProPublica的一项调查揭露了一个由AI生成的虚假石油储存公司网站几乎误导了记者,暴露了在新闻业中验证AI生成内容所面临的挑战。
引用自 Emanuel Maiberg,404 Media
谷歌要求404 Media在文章发布后修改一段表述,删除了"保持人类在决策环节中至关重要"这一措辞——这标志着谷歌在AI监督问题上的表态出现了值得关注的转变。原报道的内容是关于谷歌内部员工互相传阅调侃谷歌AI质量的表情包。
各位,好好检查你们那该死的消息来源
一篇关于技术文章中虚假引用和AI幻觉数据泛滥的吐槽,以瑞典乌鸦的假故事和代码审查缺陷检测的夸大说法为例。
KPMG因AI幻觉问题撤回AI使用报告
KPMG在发现其AI使用报告因AI幻觉而出现不准确内容后撤回了该报告,这些不准确内容由GPTZero识别,并由《金融时报》报道。