社交媒体毒性——“嘈杂的房间”
摘要
一项斯坦福大学研究分析了数十亿条社交媒体帖子后发现,仅约3%的用户会发布严重有害内容,但互动驱动型算法不成比例地放大了这部分少数声音,从而扭曲公众认知,并导致大多数用户被迫自我审查。
暂无内容
查看缓存全文
缓存时间: 2026/05/12 09:58
# 喧嚣的房间
Source: https://thenoisyroom.com/
这一切始于一项研究。2025年12月,Stanford researchers分析了22亿条社交媒体帖子(https://doi.org/10.1093/pnasnexus/pgaf310),试图寻找某种规律。他们想知道有多少比例的用户发布了*极其*有毒的内容。不是无礼,不是讽刺,而是那种令人憎恶到全世界90%的人都会将其标记为有害的言论¹。
掌握这些数据后,他们随后向数千人提出了一个简单的問題:
猜猜看。
你认为社交媒体用户中有多少比例会发布极其有毒的内容?
0% 50% 100%
结果令他们大吃一惊。他们发现了一个隐藏在明处、却长期被忽视的巨大认知偏差库。
### 酒吧
这是该问题最简单的模型。想象你走进一家有100人的酒吧。
其中三个人在大喊大叫——聊政治、互相攻击、或者任何能引发情绪的话题。其余九十七人则以正常的音量交谈。但门口有个保安,你的每一秒驻足他都要收费。于是他把那三个嗓门最大的人接到了音响系统上,并把音量调到了最大。
你走进去,听到震耳欲聋的喧嚣,得出结论:*这里全是疯子。*完全没有注意到几英尺外那97个人正在正常聊天。你*可以*离开,但你所有的朋友都在里面。你被卡住了。
Twitter/X 就是这样处理争议性话题的。门口的保安就是一个算法。不管你喜不喜欢,你都一直是个旁观者。
挑一个争议性话题看看。你的信息流大概长这样。
阅读这些信息流,你可能会合理地推断出这个国家已经分裂成两个疯狂的极端阵营。事实并非如此。而 Americans actually believe 和信息流所暗示的观点之间的差距,可能是 Platforms 至今未能向你展示的最具深远影响的事情。
### 看清房间全貌
让我们把这个场景可视化为一间装着100个人的房间。情况如下:
3 名发布过有毒内容的用户
3%→33% 在大多数平台上,约3%的账号产出了三分之一的全部内容
你的信息流:互动排名机制放大了极少数高产用户发出的高反响内容
**真实的房间:**100 名用户中只有 3 人曾经发布过极其有毒的内容。
这种模式在各平台反复上演。在 Twitter/X 上,有毒推文获得的转发量比普通推文多约 86%(https://doi.org/10.1126/science.adl4435),曝光量也多出约 27%。仅 0.3% 的用户分享了 80% 的所有争议性新闻(https://doi.org/10.1126/science.adl4435)¹⁴,仅有 6% 的用户产出了大约 73% 的政治类推文(https://press.princeton.edu/books/hardcover/9780691203423/breaking-the-social-media-prism)¹⁶。在 TikTok 上,25% 的用户产出了 98% 的全部公开视频(https://www.pewresearch.org/internet/2024/02/22/how-u-s-adults-use-tiktok/)¹⁵。具体数字可能有所不同,但底层逻辑一致:少数高度活跃的用户彻底淹没了多数用户的声音。
在这间“房间”里浸泡久了之后,你的大脑会自动进行一种环境人口学统计。信息流变成了一种变相的人口普查。你会合乎逻辑地得出一个结论:这种行为一定非常普遍。这房间里可能真的挤满了极端的家伙!也许大多数人*确实*信这些疯狂的说法。
### 这不仅仅是社交媒体上看到的问题
如果这只是关于我们社交帖子语气的问题,那倒没什么大不了的。但这种扭曲最终导致了一些相当糟糕的行为模式。
**模式 1:多数派陷入沉默** 当大多数人看着信息流并以为自己人少势微时,往往会*自我审查*(https://doi.org/10.1111/j.1460-2466.1974.tb00367.x)³。这种现象在社交媒体上不断重演(https://doi.org/10.1016/j.techsoc.2023.102431)¹⁷——对被社会孤立起来的恐惧压制了观点表达,尤其是在那些被认为不受欢迎的平台上。他们选择沉默,或者直接离开该平台。公共空间就这样被政治立场更极端的少数派接管了。
**模式 2:大声的少数派误以为自己是多数派** 积极发帖的少数派也会产生自己的认知扭曲——他们坚信自己代表着多数派。⁵
针对 17 个极端主义论坛的研究(https://doi.org/10.1093/poq/nfn056)发现了同样的模式:某人发帖越多,就越相信公众与其观点一致。参与度越高的参与行为孕育了虚假共识。
**模式 3:双方严重误解彼此** 双方都形成了关于对方真实面貌的*极度不准确*的认知(https://doi.org/10.1086/697253)⁶。看看你自己的某些信念是如何对应的:
你认为**Democratic supporters**中有多少比例是 LGBTQ?
0% 50% 100%
你认为**Republican supporters**中有多少比例年薪超过 $250,000?
0% 50% 100%
这种扭曲也延伸到了政策看法上。点击此处查看关于**the issue of immigration**的认知差异。
Source: More in Common (2019) & Moore-Berg et al., PNAS 2020. 示意图。
**模式 4:政客追随的是“感知中的房间”,而非现实** 民选官员非常擅长捕捉政治风向。这简直是他们的工作职责。(他们*并非*被选出来去纠正人们的错误观念。)
能够围绕一种*感知中的共识*组建联盟的政客更容易获胜。他们会将自己定位在与一个并不存在、但支持者*认为存在*的对手作对。
别忘了:如今我们的政治活动大多发生在社交媒体上。Candidates 通常看到的也是同一条扭曲的信息流。他们不太可能改变看法。
话语的窗口发生了偏移。不是因为人们的观点变了,而是因为人们*对于观点的看法*变了。
**模式 5:认知偏差转化为敌意** 当你认为对方处于极端位置时,你会*更愿意*将他们视为威胁(https://doi.org/10.1073/pnas.2116851119)⁷。
Democrats 和 Republicans 都**严重高估了对立阵营支持政治暴力的比例**。其结果是,民众时刻准备着认定对方随时会做出可怕的事情。
"What percentage of the other side supports political violence?"
Democrats believe estimate of Republicans support political violence
Republicans believe estimate of Democrats support political violence
双方的估算偏差高达**3 到 4 倍**。当 researchers 纠正这些认知后,党派敌意显著下降。
每一步都在反哺下一步。这种扭曲具有自我强化的特性。
### 仅仅“知道”还不够
好的。现在你*知道*少数派主导了信息流。
你知道 Republican supporters 和 Democratic supporters 在争议性议题上其实持有更为细致多元的观点。
**这就解决问题了吗?** 并没有。你也知道*其他人*并不知道这一点。如果世界继续按照“扭曲是真实存在的”这一假设立体运作,你大概率也得照做——即使你知道那是错的。即便你清楚里面的人搞错了,但这间“房间”本身并没有改变。
这在博弈论中被称为**common knowledge problem**。
你看到了这个数据。但你完全不知道别人是否也看到了。信息流看起来依然如故。你还是觉得自己人少势微。你选择了沉默。
Steven Pinker 在他的新书 *When Everyone Knows That Everyone Knows*(https://www.simonandschuster.com/books/When-Everyone-Knows-That-Everyone-Knows/Steven-Pinker/9781668011577)⁸ 中清晰地阐述了这一点。了解一个事实只会改变你*所知道的*。但当它被公开展示——所有人都能看到,且你知道别人也能看到时——它就会改变所有人所知的内容,进而改变他们的*行为*。
Twitter/X 等平台上没有公共广场。它有 3 亿扇私人窗户,每扇窗都展现着对这同一间房间的不同扭曲。照亮我们之间的共识,或许能从根本上改变这一切。
### 核心构想
那么我们该如何应对这种情况?
幸运的是,已有充分证据表明如何修复这一问题。多项研究表明,以公开方式纠正认知偏差后,敌意会显著下降。Mernyk et al. 发现,仅需一次纠正就能将党派敌意降低整整一个月(https://doi.org/10.1073/pnas.2116851119)⁷。Lee et al. 发现,纠正对 toxic users 数量的夸大估计,改善了人们对国家和彼此的感受(https://doi.org/10.1093/pnasnexus/pgaf310)¹。
**我们今天就可以实现这一点。**
想象一下,每条争议性话题的帖子下方都有一个不起眼的链接。不是 fact check,不是标签,也不是警告。取而代之的是——如果它有一个 ***Community Check*** 按钮呢?
↑click here ***Community Check*** 是一个开源的设计层,可部署于各社交媒体平台的争议性帖子下方,帮助用户理解 platform 上的其他用户(或整个 Nation)对该议题的真实看法。
这是一种为最热门的网络争议议题快速补充背景的方法,让人们更能看清 public 的真实意见。
### 构想落地演示
让我们用一个跨越政治身份认同的话题来探索这一干预措施:
#### 金钱与政治
表面上看,这似乎充满争议。但实际上,这是一个拥有超级多数的议题:**81%** 的人担忧 money 对 elections 的影响,其中包括**78% 的 Republican supporters**和**90% 的 Democratic supporters**。**75%** 的人认为 unlimited spending 会削弱 democracy。仅有**15%** 的人认为 unlimited political spending 属于受保护的 free speech。
然而,现状几乎没有改变,很大程度上是因为每个人都默认对方对此持接受态度。Feed 里满是替己方 donors 辩护、攻击对方 donors 的人。看起来像是 50/50 的 partisan battle,其实不然。这是一个无法自我察觉的 majority consensus。
假如你能直接看到这个共识呢?
@real\_talk\_politics · 2h
Everyone complains about money in politics but the second their candidate gets a massive donation they shut up real fast\. You don't hate money in politics\. You hate when the OTHER side has more of it\.
♡ 11,847💬 6,203↻ 2,891
↑click here ***Community Check*** draws from a**random sample of platform users + robust national polls**, surveyed independently of the content. The sample is statistically representative. The results update continuously. And critically:*everyone sees the same numbers*.
### 为什么这不是 Fact Checking 或 Audience Polling
传统的 fact-checking 是一种自上而下的方式,常常给人一种居高临下说教的错觉,让人难以接受。多年来,content moderation 一直被公众视为一种“删帖”行为。而我们只是提供 context 补充,这与众包 feature Community Notes(https://communitynotes.x.com/guide/en/about/introduction)(本项目的灵感来源)类似。
这也不仅仅是帖子下方的一个 user-poll。相反,它汇聚了 all platform users 的数据,并结合了具有统计显著性的 national surveys。它为 majority 的观点提供了一个真正的窗口,而不只是 currently viewing the post 的用户的观点。
### 同样适用于 Video
Short-form video 是 political distortion 传播最快的载体。同样的 dynamics 依然存在——极少数的 creators 产出了绝大多数 political content——但 video 跳过了 text 带来的思考停顿期。Community Check 也可以适配短视频。点击查看它是如何实现的。
Money IS free speech.
Deal with it. 🇺🇸
Citizens United was CORRECT
@liberty\_caucus\_tv Follow
\#FreeSpeech \#CitizensUnited 🔥
一条政治类 video 突破了 engagement threshold。51K views, 612 comments (1.2%), 1.7K shares (3.4%). Feed 显示出一片 outrage。但人们实际上是怎么想的呢?
详见下方工作技术原理说明 ↓(https://thenoisyroom.com/#tech-spec)
### 我们现在就能做到
Platforms 已经具备了许多相关能力。它们一直在 survey users。甚至知道如何运行 sophisticated polls。只需完善一些 technical details(see spec here (https://thenoisyroom.com/#tech-spec)),这并不是一个难以攻克的难题。
看不见的 majority 正是 the public。而 the public 有权认清自己。
极少数的声音主导了 feed。这从来都只是表象。我们其余的人都一直在这里,安静、理性,只等待被看见。
Follow my other work here (https://tobias.substack.com/)
Community Check 是一项免费且开放的技术规范。
完整的 technical spec、research base 及 open questions 均已公开发布,供 researchers、engineers 和 platform designers 进行 stress-test 与二次开发。欢迎引用并在此基础上构建,请注明出处。
View on GitHub (https://github.com/rosestt/communitycheck)
### Common Questions
### Technical Specification
From data sources to platform integration, 详细说明 Community Check 在实际应用中的工作机制。
相似文章
Twitch聊天中的毒性:基于LLM的跨游戏社区分析
本文使用预训练LLM进行零样本分类,分析了约2000万条Twitch聊天信息,涵盖七种游戏类型,发现2.4%的消息具有毒性,其中MOBA游戏的毒性率最高(3.2%),体育游戏最低(2%)。研究还发现,同一类型内不同游戏之间的毒性分布存在显著差异。
噪声感知下的选择性控制:模块化网络中被聚合指标掩盖的治理失败
本文表明,内容审核系统可能对连接不同社区的桥梁用户造成不成比例的伤害,即使聚合准确性指标看似令人满意,且在假阳性严重的情况下治理损失会增加。
大型语言模型中的毒性测量与缓解:一项全面的复制研究
这项复制研究评估了DExperts在缓解LLM毒性方面的效果,发现其对显式毒性几乎完美安全,但对隐式仇恨言论效果降低,并且存在显著的延迟权衡。
反社交:如今主导社交媒体信息流的是潮流而非朋友
社交媒体平台已从个人沟通转变为由短视频和内容创作者主导的娱乐中心,导致用户主动发帖量下降。
默认极化:LLM 内容策展中的推荐偏差审计
本文对 OpenAI、Anthropic 和 Google 的基于 LLM 的内容策展推荐偏差进行了大规模审计,使用了来自 Twitter/X、Bluesky 和 Reddit 数据的 540,000 次模拟选择。研究发现 LLM 系统性地放大极化现象,在毒性处理方面表现出不同的权衡,并显示出显著的政治倾向偏差,倾向于左倾作者,尽管数据集中右倾作者占多数。