写作的社会契约

Lobsters Hottest 新闻

摘要

本文讨论了LLM如何使写作同质化,并违反了作者与读者之间的社会契约,引用了Oxide的RFD 576以及一项关于ChatGPT影响口语的研究。

<p><a href="https://lobste.rs/s/kgem4b/social_contract_writing">评论</a></p>
查看原文
查看缓存全文

缓存时间: 2026/05/25 13:08

# 写作的社会契约 来源:https://jola.dev/posts/the-social-contract-of-writing LLM 正在渗透地球上几乎每一个行业,如今它们无处不在。AI 做这个,AI 做那个,只要有人愿意为某件事付费,就有人想方设法用 LLM 去实现它。但没有任何人类活动像写作那样被 LLM 所主导。并不是说我看不到它作为作者的吸引力,尤其是当你感到有压力需要大量产出内容时——它们在数量上非常擅长。我过去曾尝试过 LLM 辅助写作(如今连拼写检查我都不再用它们了)。 人们在博客、社交媒体、报纸、书籍上使用 LLM 辅助写作,也用来做拼写检查、语法检查、事实核查——不幸的是,更多情况下直接让 LLM 代笔写完整篇文章。一旦你学会识别 LLM 写作的惯用表达和独特风格,你就再也无法忽视它了。它无处不在,而且令人精疲力竭。 更糟糕的是,它很无聊。所有的写作都在同质化,慢慢变成同样的垃圾。到处都能看到相同的模式:“不是 x,而是为什么”,破折号,或者干脆来一句:“你没看错,这个问题是*真实存在的*”。最后这个表达简直让我抓狂——我不知道为什么,就是无法忍受。 越来越多的人对这种批量生产的垃圾产生强烈反感。花时间读点东西,结果却发现作者并没有投入相应的时间去写,这真让人恼火。有趣的是,即使内容本身可能还不错——正确、经过充分研究——也无关紧要。 ## Oxide RFD 576(https://rfd.shared.oxide.computer/rfd/0576#_llms_as_writers) 这是我读到的第一篇真正让我觉得把问题说清楚了的文章。Oxide Computers 有一个很棒的惯例:编写长篇文档来推动讨论并确立规范,称为“讨论请求”(Request for Discussions),其中许多是公开的。RFD 576 涉及 LLM 的使用。与此特别相关的是第 2.4 节“LLM 作为写作者”。 > 最后,LLM 生成的散文破坏了一种社会契约:在没有 LLM 的情况下,读者和作者之间,通常假定作者付出了更大的脑力劳动。(也就是说,写作比阅读更费力!)对读者来说,这一点很重要:如果读者对某个概念感到困惑,他们可以合理地认为作者本人是理解的——而读者至少应该努力去理解它。 所以,实际上,内容好不好,甚至文字是否通顺,都不重要——重要的是使用 LLM 写作而不是自己写作这一行为。作者减少了用于产出内容所付出的努力这一事实本身,就是对社会契约的违反。 ## 你无法避免它 即使你避免使用 LLM 来写作,你很可能仍然受到大量生成文本的影响。除了用 LLM 的语言来嘲讽 LLM 本身(比如无处不在的“你说得完全正确”),这些工具正在悄然改变我们的说话方式。马克斯·普朗克人类发展研究所的一项研究(https://arxiv.org/html/2409.01754v1)表明,ChatGPT 对某些特定词汇的偏好,使得这些词汇甚至在*口头*人类语言中变得更加常见——例如“delve”(深入探究)、“realm”(领域)、“meticulous”(一丝不苟)、“adept”(擅长)、“boast”(拥有)、“swift”(迅速)、“comprehend”(理解)等。即使你不直接使用它,生成式 AI 的产物也无所不在。 低本底钢(https://en.wikipedia.org/wiki/Low-background_steel)指的是第一批原子弹爆炸前生产的钢材,如今越来越受追捧。1940 年代和 50 年代的多次核试验向大气中释放了足够多的放射性物质,污染了整个地球表面,此后生产的钢材对于某些应用(如粒子探测器)来说不够“纯净”。好吧,实际上这个说法现在已经不完全正确了。全球人为背景辐射似乎已经下降到足够低的水平,近期生产的钢材已经可以用于大多数这些用途。但我们别让这个事实妨碍了一个好比喻。 任何在 2022 年 11 月 30 日(https://en.wikipedia.org/wiki/ChatGPT)之后写下的文字,都或多或少受到 LLM 普及的影响。除非你只读旧内容,否则你无法回避这一点。 ## LLM 时代后的写作 除了微妙的污染之外,对原创思想和表达的需求只会越来越大——无论是来自个人人类,还是来自模型公司作为训练材料。随着生成内容接管越来越多的互联网,不使用 LLM 撰写原创内容的能力将变得更有价值。我想,困难的部分将是在 LinkedIn 上那些思想领导力帖子以及 AI 生成的猫咪图片的持续冲击中找到它。 这一现象最有趣的后果之一,是它如何影响我们对“好写作”的定义。只要人类有语法和写作,我们就一直关注写得是否出色。我们把良好的语法、丰富的词汇、巧妙运用表达和比喻以及整体篇章布局视为最高标准。LLM 在这些方面都做得不错。当然,它们就是不断重复相同的模式,表达已经用烂了,比喻有些牵强,还把破折号的名声搞坏了。但现实是,今天的学生在学校里可以选择要么努力学习得个平均分,要么什么都不做,让 ChatGPT 写论文然后拿到高分。把今天 Claude 写的东西拿给 10 年前的人看,我怀疑他们不会有太多抱怨。随着时间的推移,当你读得足够多时,它会变得重复,但它确实符合很多“规范写作”的传统标准。不是诺贝尔奖水平,但还行。 但今天,我渴望的是原创表达。我不在乎语法是否正确,只要它*与众不同*。我不在乎词汇量是否有限,请不要再用“delve”这个词。我不会再因为作者有拼写错误而看不起他们,我会珍惜每一个错误。我不想再要那种由 AI 生成的、平淡无奇的人类平均水平,我想要古怪、想要不同。我想要*人类*的写作。 ## 我承诺不使用 LLM 写作 你花时间读了我写的东西,我很感激。我也履行了我的那一半契约:我花了大半天的时间写这篇文章,一边看着电视上的老电影。我喜欢写作,从小到大一直在写,尽管时断时续。现在我想试着让它成为一种更常规的习惯。这感觉很有意义,值得去做。

相似文章

为了内容而内容

Armin Ronacher

作者探讨了LLM如何影响编码和日常语言中的用词,发现LLM偏好的词汇在编程会话和Google Trends中出现的频率均有所增加,这引发了人们对人类开始采用LLM写作风格的担忧。

不仅仅是X,更是Y

Hacker News Top

本文探讨了LLM的后训练(RLHF和RLVR)如何产生诸如否定平行结构之类的语言特征,并批评了使用AI检测工具(Grammarly、Pangram)的做法,这些工具迫使写作者为了避免被误判而模仿机器语言。