Cave of Forgotten Dreams
摘要
一篇关于在一位严重依赖AI来调解对话和提供反馈的老板手下工作所带来的令人不安的动态的个人反思,这种动态导致了递归循环和直接人际互动的缺失。
<p><a href="https://lobste.rs/s/qcnd5q/cave_forgotten_dreams">评论</a></p>
查看缓存全文
缓存时间: 2026/06/03 01:39
# charles leifer | 失落梦境之洞
来源:https://charlesleifer.com/blog/cave-of-forgotten-dreams/
2026年6月2日 10:08 / [ai](https://charlesleifer.com/blog/tags/ai/) [thoughts](https://charlesleifer.com/blog/tags/thoughts/) / [0条评论](https://charlesleifer.com/blog/cave-of-forgotten-dreams/#comments)
> 谁用无知的言语,使旨意暗昧不明?因此我说了我所不明白的事;这些事太奇妙,是我不知道的。
AI大约在今年二月开始主导我的意识。起初,我认为这种执念的主要驱动力是工作上的领导层变动。我的新老板几乎所有工作相关的事务都重度依赖AI。他上任一两个月后,我们在一次关于产品路线图和可能的客户公告的电话会议中进行了45分钟。突然,他说:“稍等一下——”然后开始共享屏幕。熟悉的MacOS桌面、浏览器中打开的Claude,填满了显示屏。他把我们当时为止的通话记录复制下来(他记录每次通话的文本,以便将文字输入AI),打开一个新对话,并输入提示词:“说说查理哪里对,哪里错。说说我哪里对,哪里错。”我看了看右下角的头像。我们两人都安静地等待Claude思考,然后它逐条朗读出发现,贴心地点列出来,每人各占一半。我觉得自己被迫扮演绅士角色,慷慨地同意Claude对我观点那些温和(非常温和)的批评,同时处处让步于Claude对我老板那种微妙(非常微妙)的认可。通话不久后便结束了,我想我们俩都感到有些尴尬。我刚刚经历了一种最令人困惑的混合体:既有极度的透明,又有难以理解的晦涩。
photos/the-soothsayer-s-recompense-1913.jpg (https://media.charlesleifer.com/blog/photos/the-soothsayer-s-recompense-1913.jpg)
是我失手了,还是像真正的弓箭手一样击中了猎物?或者我不过是谎言的先知,挨家挨户地胡言乱语?——埃斯库罗斯《阿伽门农》
在他上任之初,我最初通过Slack回答新老板的问题时,一如平时对同事那样坦诚而详细。几次之后,我发现我的回复从未被当作讨论对象,顶多得到一个表情符号回应。相反,我观察到我的回复被直接输入到他的AI助手中,而AI的回复又被逐字返回给我——通常只是发个链接,有时会附上一句“看看这个”。没有任何掩饰的企图,我老板一向坦诚得令人耳目一新,但这些互动形式是我身处其中之前从未想象过的。看到“查理说……”出现在别人的聊天提示词中,是一种令人不安、无助的感觉。更令人不安的是,AI在回复中直接点名我,仿佛我不在场一样。
我因此调整了自己,偶尔成为腹语师,预先给出自己的评论,利用AI避免出现会被他的AI抓住的把柄,以免让自己信誉受损,也避免显得像个AI反对者。在心理上,我开始对他的模型进行建模,预判可能会出现的核心语句,以及那句常见的总结性名言。我陷入了一场荒诞的电话传话游戏,但我感觉必须玩下去,否则就要承受他的AI转而针对我的后果。从他的角度看,我只能想象管理一家新公司的挑战让他需要关注太多事情,以至于他只能依靠AI的快速总结。然而,我实际上正在经历我在之前一篇文章中写到的(https://charlesleifer.com/blog/tokens-and-dreams/)关于代理型编码模式的递归反馈循环,只不过发生在现实生活的人际互动中。与此同时,我还要应对一些随机问题,比如“AI代理能不能周末给我们写个API?”,收到指向gstack(https://github.com/garrytan/gstack)的链接(它曾以产生大量代码记录而闻名),并且通常充当缓冲区和技术评审人,处理AI炒作人群那一周谈论的任何内容,以便我的回复可以再被输入回Claude。我感到相当不知所措。
这种对我意识的干扰并没有被我忽视,但我完全无法从中自拔。它感觉紧迫,我想摆脱这种侵扰。我感觉到这些模型有弱点,于是决定武装自己,转守为攻。我的计划很简单:在我的心灵法庭上起诉、定罪、监禁这些模型。(当然,我当初并没有以这样的词语来思考,但回想起来,大概就是这种色彩。)
由于案件需要证据,我成了一名法医分析师,仔细审视Claude生成的输出。我早在今年一月进行的第一个实验可追溯到这个疯狂状态之前,但策略的萌芽已经存在。我会忽略那些奉承的语气、安慰性的语调,以及自信十足的陈述错误。我认定的论点是:正确性与连贯性不可互换,而对代码来说连贯性重要得多。到Opus 4.5版本时,无可否认Claude能够产生相当正确的代码片段。但它如何处理大局——各个部分之间的连贯性和统一性?通过在我自己的开源项目上执行一系列越来越有挑战性的任务(这些项目的意图我非常清楚),我开始构建我的论点。
photos/my-good-man.png (https://media.charlesleifer.com/blog/photos/my-good-man.png)
我并不自命清高。
我接受了免费的六个月Claude Max试用,因此可以使用最好的前沿模型。随着迭代次数的增加,我越来越相信自己发现了什么。然而,要判断Claude产生的diff,需要仔细审查。它们有一种阴险的方式,看起来如此显而易见,以至于几乎下意识地就一带而过。它们看起来几乎是必然的。但我仔细审视,并且得到了回报。这些改动常常在试图修复问题的同时,至少引入了同样多的新问题。这种情况一次又一次地出现,从小型、独立的任务,到大型遗留代码库中的工作。
我似乎正在构建一个无懈可击的案子,但这些虚幻的胜利时刻与我实际的生活现实完全脱节。在工作中,仍然是AI主导一切。旧的产品路线图已经被抛弃,从今往后都是AI,直到永远,阿门。我的新闻推送依旧轰炸不断。
到底发生了什么?我的老板是一个真诚善良的人,我非常喜欢他。然而,在这个陌生的位置上,面对困难时,他选择了AI作为无痛的方式来做出决定并继续前进。过去,我的上级必须从内部深刻理解游戏规则,否则就得另谋高就。LLM从根本上重新定义了这种难度,仿佛将难度移到了别处。现在AI模仿思考过程,允许人们假装完成了它,从而产生一个未经深思熟虑的结果(或决策)。我也同样有共谋之嫌。出于害怕被误解的恐惧,我试图预先审查自己的评论,以期预判他的模型的输出。而与此同时,产品路线图的目标正是将这种无摩擦的困难消隐交付给我们的客户。
阵亡将士纪念日周末,妻子和孩子们去奥扎克斯湖,在岳父母家的湖边别墅过周末。我因为天气太冷不适合游泳留了下来,并且计划周末和几个朋友骑越野摩托。独自在家,感到焦躁不安,我不断回到AI这件事上。为什么明确的失败证据、那种被证明正确的感觉,却显得如此空洞,甚至更糟——毫无意义?
当LLM在所有人类文字(所有时间)上训练时,会出现一种廉价的流畅性,我认为这一点目前已经无可否认。这并非我最困扰之处。我认为对我来说真正的问题是,AI无法区分哪些困难值得保留,哪些值得消除。批判性思考、置身于不确定性中、权衡选择、做出判断,这些都是真正的专业能力的标志,需要一个人多年的发展才能具备。在某些时候,摘要模式是有价值的,但当它变成一种(反)知识习惯、一种反射,而深入思考的实践被顺口的名言所取代时,会发生什么?我们自己因为廉价和容易而愿意接受这种流畅性,反过来是否贬低了每个个体的工作和尊严?
当我将一份公司内部指标CSV输入Claude,并获得一组信息丰富的图表和要点化的见解时,结果感觉很神奇。那些数据中潜藏着答案,AI能够清晰地呈现它们,并且让它们易于与他人分享。在复杂的编程任务中,答案往往不那么明显,需要考虑许多权衡。在战略思维、长期规划或权衡相互冲突且相互关联的决策时,很可能并没有正确答案。AI不会区分这些。它可以为任何技术或战略问题提供几句赞赏性的短语来敷衍过去。问题从来不是关于输出的质量,甚至不一定是输出的数量和阴险的扩散。问题在于,面对困难时,我会打开Claude。我一直在构建的案子在我眼前消失了,被驳回,并带有偏见。
在空荡荡的房子里,我重新发现,我获得意义感的方式来自尝试困难的事情、来自能够批判性地思考、深刻地感受、骑车摔倒再爬起来。选择权在我手上。抛开工作上的必要,是我自己可以选择。冲突突然转移到了我再次感到自在的领域——我自己的人生。我骑上摩托车,沿着河边小径飞驰,感受泥水溅到腿上,骂了一声,从车辙中跳出,差点撞上一棵树,感受摩托车在加速冲上短跳台时的澎湃动力。
我想我是如何每隔几年就重读我喜欢的书。我重读它们,是因为随着我年龄增长,当我再次回到它们面前时,它们似乎总能呈现出新的维度,向我反射出中间这些年的经历。40岁时再次阅读《大卫·科波菲尔》,我第一次觉察到从贝齐姨婆身上辐射出来的爱的关系网络。她不感情用事的慈善接纳他人(包括他们的局限),无私地希望他们好,并产生了一个爱的引力中心,使大卫的最高成就成为可能。当我20岁第一次读它时,我甚至不曾理解这种坚定不移的爱是什么。狄更斯艺术的一个全新维度展现在我面前供我深思。他通过他的艺术展现出的对人类的爱,成为了我的一部分。
我们的第三个孩子出生时,我们没有合适的地方放他,所以在他出生后的大多数时间里,他睡在我们卧室的便携式婴儿床里。到了春天,我们决定卖掉我们舒适的都铎复兴风格住宅,换一栋能更好地容纳我们不断增长的家庭的房子。我们之前把房子卖给了一对律师夫妇,后果可想而知,所以这次我急于卖给在2022年常见的没那么严格的买家。房子很旧,除了地下室进水、旋钮式管线和屋顶老化外,我担心仔细检查会发现什么未知缺陷。大约一两周后,我们收到了报价,我能看出我们的中介不高兴。那是一个退伍军人家庭,用VA贷款购买。VA贷款要求的检查比通常严格得多,而我们房子正好有那些检查旨在发现的问题。我反对接受,因为我们会面临耗时费钱的修复工作,但我的妻子指出,他们出价是标价,而且很可能会像我们一样爱这所房子。我勉强同意试一试,接受了报价。在检查前的一两周里,我处于持续焦虑的状态。我躺在床上策划如何能快速又粗劣地修补,以便隐藏一些检查中可能暴露的问题。有一天下午,我带孩子们去了附近的公园,看着他们玩耍,同时和我妈妈通电话。听我讲了一会后,她打断我说:“你知道,如果你不再试图在这件事上‘赢’,而只是做一个好人呢?想想你*自己*想搬进什么样的家。”她的话直击我的心,那一刻我意识到她道出了更高、更好的真理。在接下来的几周里,我坦诚地向检查员说明了我所知道的房子所有问题,我们住在这里期间做了哪些改进(没有),并且真诚地希望让房子为新家庭做好准备。我出于正确的理由做了正确的事,而修复房子的困难,与前几周我感受到的持续焦虑相比,根本算不了什么。
在困难中支撑我的不是单一一件事。骑摩托车时,只有我、车和环境。卖房子时,是更难的事:从自私的算计转向相信正确的原则付诸行动后会产生好的结果。AI无法解决任何一点,因为对技术掌握的满足感本身就是练习时间带来的回报。同样,它也无法取代信念,因为信念建立于希望之上,而这只有通过行动并跃入未知才能生长。是我对这些困难所赋予的价值,使得AI的廉价流畅性如此令人痛苦。接受简单的答案、快速的修复,回避了带来成长的劳作和不适。经历了大量的痛苦、错误、失去,我才理解了狄更斯写入贝齐精神的那种爱的价值。
大约20年前,我还做过另一个梦。那是一个极其罕见的半清醒梦——我站在一条城市街道上,像林荫大道,两旁是小商店和餐馆,我突然意识到自己在做梦。我飘落到人行道旁间隔种植的一棵树树枝上,摘下一片叶子拿在手里。我凝视着它,仔细检查叶子的表面。我想看看这个世界究竟有多细致——这片叶子会长有细小的、分叉的叶脉、气孔、瑕疵和生命吗?我梦中的叶子是由我的潜意识创造的(也许我只是梦到我有*看到*一片细节叶子的*印象*),但这种体验来自内在。
photos/but-what-in-the-devil-were-they-doing-in-that-cave.jpg (https://media.charlesleifer.com/blog/photos/but-what-in-the-devil-were-they-doing-in-that-cave.jpg)
我的办公室里有一幅拉斯科洞穴“公牛大厅”的版画。这些画估计制作于大约17000年前,而数百公里外的肖维岩洞中的画作比拉斯科还要早约17000年。我看着这幅画,它既透明又晦涩,其作者是一个谜。17000年前,或30000年前,或任何千年之前,一个人站在洞穴冰冷的黑暗中,以动物脂肪为燃料的灯照亮,将木炭和赭石涂抹在裸露的岩壁上。尽管如此,这些幻象无疑是出自人类之手。而我现在在这里,想知道他们到底在那个洞穴里做些什么。
---
相似文章
我工作的公司正在失去人性,我不知道该去哪里
一篇个人博客文章,详细描述了一位软件开发者所在公司日益专注于AI而牺牲员工福祉的经历,导致了裁员、倦怠和人性丧失。
AI电影制作的无思想性
一篇关于AI电影制作缺乏意图性的评论文章,包含Kane Parsons对生成式AI的批评以及业界对AI在创意作品中滥用的反应。
你的AI使用正在搞垮我的大脑:为什么10分钟的提示就能让我们废掉[D]
一篇个人随笔讨论了过度使用AI工具如何导致认知过载和精神疲劳,引用了BCG、Wired和其他来源的研究,表明AI会增加脑力劳动并导致技能萎缩。
在工作场所假装高效——没人开心
这篇文章批评了工作场所中AI生成内容的泛滥,员工使用Claude等工具来产出看似专业的内容,却缺乏真实的专业知识,导致管理和问责方面的系统性问题。
AI、“人性”与曼哈顿博士症候群:一场传播干预
一篇评论文章,批评那些宣称关心抽象‘人性’却忽视真实个体的AI高管,以曼哈顿博士的原型比喻这种脱节。