我不是一个 Reverse Centaur
摘要
Miguel Grinberg 解释了他拒绝接受由 LLMs 生成的未经请求的拉取请求,坚持需要人工参与以避免成为 'reverse centaur'。
暂无内容
查看缓存全文
缓存时间: 2026/06/12 20:56
# 我不是反向半人马
来源:https://blog.miguelgrinberg.com/post/i-am-not-a-reverse-centaur
大约一年前,我在本博客上写过,即使没有道德或环境方面的顾虑阻止我使用,**用 LLM 编码对我来说也行不通**(https://blog.miguelgrinberg.com/post/why-generative-ai-coding-tools-and-agents-do-not-work-for-me)。我不打算重复当时的论点,因为我的看法没有改变。但改变的是,我收到的开源项目贡献数量增加了,而且现在几乎全部都是用 LLM 制作的。
前几天我对此产生了一个非常沮丧的想法。所有这些向我的项目提交“路过式”拉取请求的人,都在迫使我把越来越多的时间花在审查和合并由机器挤压出来的代码上。Cory Doctorow 将执行这种功能的人称为 *反向半人马*。他称这些是“脆弱而脆弱的人被冷漠无情的机器操纵”。哎!
我现在是反向半人马了吗?作为一名经验丰富的软件工程师和开源开发者,我新的使命就是日复一日地审查 LLM 代码,尽管我已经决定自己既不需要也不想要这项技术?正如标题所暗示的,我永远不会成为反向半人马。让我告诉你我如何抵制那些想让我成为它的人。
## 不再接受未经请求的拉取请求
在 LLM 时代之前,收到其他开发者的意外拉取请求(PR)是令人兴奋和自豪的源泉。这意味着某个陌生人认为值得投入时间和精力来改进我的项目,并将结果分享给我和所有用户。
如今,未经请求的 PR 是一个危险信号。太多人懒得用 LLM 代码生成工具,只是提示它改动我的某个开源项目的行为以满足他们的特定需求,根本不关心改了什么或者对其它用户有何影响。有时这些改动有意义并改进了项目,但往往并不如此。提交者通常不怎么关心,他们只是甩上一大段 LLM 生成的描述,然后提交 PR,留下我来判断这个改动是否合理还是纯粹的垃圾。
我决定有比把时间花在审查 LLM 产生的代码上更重要的事情。如果你想为我的项目做贡献,我希望你是直接的贡献者,并且对改进我的项目有真正的兴趣。
我在所有开源项目中包含的贡献指南都有以下说明给贡献者:
> 如果您有兴趣为这个项目贡献更改,请先在 issue 中向维护者介绍您希望进行的更改。未经事先在 issue 中讨论而提交的拉取请求可能会由维护者自行决定关闭。一旦维护者接受了您建议的更改并允许您开始工作,请随时提交拉取请求。
通过这个过程,我能在任何一方投入大量时间之前了解贡献者和他们的提案,这对每个人都是双赢。
尽管如此,我仍然收到未经请求的 PR,所以很明显有些用户(或者更可能是他们的 LLM)不读贡献指南。当收到新的意外 PR 时,我的首要任务是判断背后是否有人,幸运的是这很容易在几秒钟内判断出来。如果我看不到人类参与的迹象,那么我就不感兴趣,所以 PR 会立即关闭,不询问任何问题。
你可能会说,这种态度可能会让我错过一些有用的改进或错误修复,我认为这是可能的。我确实没有办法在不花时间审查这些未经请求的 PR 来区分好坏的情况下知道。当我确信每个贡献背后都有人的努力时,这种审查工作是合理的,我甚至很喜欢它。在今天这个充满垃圾的世界里,这是反向半人马的工作,不适合我,所以我只关注来自积极参与贡献者的 PR。
我的建议是,如果你只能在 LLM 帮助下编码,并且需要在我的项目中做修正或改进,不要浪费你的 token 在 PR 上,因为我会忽略它。相反,在 issue 中描述问题,让我来处理工作。我不想要 LLM 生成的带有章节、要点和表情符号的小说,只需要用你自己的语言简单描述问题。既然你会省下一些昂贵的 token,你也可以考虑捐款,这很可能激励我优先处理你的问题!
## 开源还重要吗?
这是我不断问自己的一个问题,我还没有明确的答案。我仍然做大量的编码,无论是工作还是娱乐,但近几年来我对分享自己制作的东西兴趣减少了。我仍有足够的兴趣来维持当前开源项目的更新,但我有一堆近期项目无法让自己公开。
我的感觉是人们对开源以及一般意义上的编码兴趣下降了。我热爱编码的主要原因是它是一种挑战,而我认为这实际上也是为什么很多人宁愿付钱给 AI 实验室让机器吐出代码的原因,即使代码质量可能很差。
这种趋势会持续到没有人再编码,只有机器在做编码吗?我希望不会,但我们只能等待看看。我将继续反对一个我们都必须成为反向半人马、由机器(及其亿万富翁主人)发号施令的未来。
感谢访问我的博客!如果你喜欢这篇文章,可以考虑通过 Buy me a coffee(https://www.buymeacoffee.com/miguelgrinberg)小额一次性捐款来支持我的工作并让我保持精神振奋。谢谢!
相似文章
我不再需要你的 PR
一位开源维护者解释为何现在更偏爱由 LLM 生成的代码,而非社区 PR:AI 辅助能降低风险与摩擦,将贡献价值转向反馈、缺陷报告与设计讨论。
应禁止LLM生成的提交内容
Lobsters上的一位用户提议应禁止LLM生成的提交内容,认为应封禁发布此类内容的用户,并添加通知提醒提交者。
引用布莱恩·坎特里尔
布莱恩·坎特里尔批评LLM缺乏人类懒惰带来的优化约束,认为LLM会不必要地使系统复杂化而非改进,并强调人类时间限制推动了高效抽象的发展。
我运营着一个基于AI的事实核查平台,却坚决不让大语言模型给出最终判定。以下是我的理由。
作者详细阐述了不让LLM生成最终事实核查判定的决定,转而采用混合架构:LLM负责数据提取,确定性Python层负责评分,并指出了随机不稳定性和可审计性的问题。
别再让大语言模型编辑你的 .bib 文件 [D]
本文批评了依赖大语言模型生成参考文献条目的做法,指出了学术论文中幻觉引用和作者列表错误的问题。