S形曲线救不了你

Hacker News Top 新闻

摘要

本文批评了常见的AI论点,即所有指数增长最终都会变成S形曲线,指出虽然个别技术会达到平台期,但新的突破可能会创造新的S形曲线,因此AI进展未必会永久停滞。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/15 21:34

# S 形曲线救不了你 来源:https://www.astralcodexten.com/p/the-sigmoids-wont-save-you “所有指数增长最终都会变成 S 形曲线”是 AI 讨论中一个令人厌烦的论点。如果有人展示这样一张图…… [](https://substackcdn.com/image/fetch/$s_!hPfO!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F08b8bdc3-afab-4e51-a14e-b18d6374384c_513x478.png) ……并指出 AI 能力似乎很快就能达到标记为“高”的水平,那么所谓“有智慧的辩论”最高水平就是指出:实际上,趋势可能像这样发展: [](https://substackcdn.com/image/fetch/$s_!YDr_!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F78bc0b7f-5818-4597-b47e-9178ac5df0f2_513x478.png) ……然后它*永远*不会达到标记为“高”的水平! 这种论点的口号形式就是“所有指数增长最终都会变成 S 形曲线”(S 形曲线即第二张图的 S 形状,起始阶段呈指数增长,但逐渐趋于平缓)。这在技术上是正确的。没有哪个过程能永远增长;最终它会触及物理或实际极限。例如,疫情期间的总病例数就是经典的 S 形曲线: [](https://substackcdn.com/image/fetch/$s_!wKWJ!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F09233796-bc94-4a3b-ac97-921397cef69c_850x496.png) 它们起始缓慢——零号病人感染一号病人,以此类推。当大多数人被感染后,增长呈指数级。然后,随着几乎所有人都被感染,只剩下最后几个顽固分子需要处理,增长速度再次放缓。最后,当所有人都被感染后,增长率为零。 特定领域的技术进步也可以是 S 形的。以下是航空速度记录随时间的变化: [](https://substackcdn.com/image/fetch/$s_!SA5R!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F2ffc7282-03c5-4312-ae24-6fddb3050102_970x722.png) 来源:https://en.wikipedia.org/wiki/List_of_flight_airspeed_records 我的理解是,这代表了 3–4 代不同技术(螺旋桨、涡轮喷气发动机等)的演进。每一代技术都经历了常规的迭代改进,然后,当达到其基本极限时,被更先进的技术所取代。最后一项技术——冲压喷气发动机——在约 3500 公里/小时达到了极限,并且由于缺乏经济/监管意愿去开发更好的技术,记录就此定格。 你可以想象 AI 在某个时点也会发生类似的情况。这是否意味着那些人的观点是正确的,我们无需担心图表会达到标记为“高”的那条线? 在得出一般性答案之前,让我们先看看“S 形曲线误认名人堂”。 **第三名** 是联合国对出生率下降国家的人口出生率预测。这些国家的出生率一直以恒定速率下降,而联合国则一直预测它们会趋于平缓,并以更低的速率下降。在这张图中,红色是实际数据,每条蓝线代表联合国在不同年份对“趋势”进行的“外推”尝试。 ![](https://substackcdn.com/image/fetch/$s_!bpU5!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F55a1b3aa-cb3b-416c-a403-751e2f57a4bb_700x404.png) 确实,出生率最终必须趋于平缓并变成 S 形曲线(去年在韩国可能已经发生了,尽管哥伦比亚和智利仍在下降),但这并不一定恰好在联合国预测者开始觉得下降“太过头”的那个时刻发生。 **第二名** 是对太阳能发电部署的预测,由 A.E. Hoekstra 记录。 ![](https://substackcdn.com/image/fetch/$s_!FIVM!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F44bd05e0-20e5-413a-aee9-3161ad2e9878_566x680.jpeg) 各种“世界能源展望”的线条是世界能源组织对太阳能发电部署速度的预测。每年,世界能源组织都认为:“哇,去年新增了很多太阳能电力,很可能今年就会趋于平稳,甚至可能略有回落。”但每年,太阳能发电的部署量都以同样的速率增长。 **第一名** 是这篇关于 METR AI 能力图表的论文。在 2026 年初,当底层数据看起来像这样时: [](https://substackcdn.com/image/fetch/$s_!U54w!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F2e412241-abc8-4885-a0a8-64130fc41a00_371x374.png) ……沃顿商学院的一个团队试图建模不同的曲线,并预测未来的可能轨迹是: [](https://substackcdn.com/image/fetch/$s_!7bDq!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F39f91129-76b9-482f-af9d-b9d7ebafc577_376x385.png) @Tenobrus 出色地记录了接下来发生的事情(绿色曲线是他们的原始预测;星号标记了他们分析之后发布的下一个 AI 模型): ![](https://substackcdn.com/image/fetch/$s_!_ZW2!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Ff784ef72-4403-4ac1-9a94-d49d5761ca7d_1600x1346.jpeg) 这个故事的道理是:尽管所有指数增长最终都会变成 S 形曲线,但这并不一定恰好在进行数据分析的那个时刻发生。有时它们持续指数增长的时间要长得多! 长多少? 预测这一点的最佳方式是充分理解驱动该趋势的过程。例如,你可以通过了解病毒的复制速度、治愈概率以及易感人群规模来预测疫情。即使是在像航空速度记录这样更困难的案例中,一位聪明的工程师也能确定冲压发动机的最大速度约为 3500 公里/小时,一位聪明的经济学家也能预测没有哪个国家有动力花费足够资金将下一个技术范式变为现实。 如果你不完全理解这个过程呢?AI 预测者知道一些事情(比如数据中心如何运作以及建设成本)。但他们不确定其他事情(研究人员不断发明新的数据生成范式来突破数据壁垒,但这种趋势能持续多久?),而其他事情则完全未知(智能到底是什么?为什么缩放定律有效?它们会不会在某一点突然失效?)。这里有什么你能做的吗? 在真正无知的情况下,默认假设应该是**林迪定律 (https://en.wikipedia.org/wiki/Lindy_effect)**:平均而言,一个过程会持续的时间与其已经持续的时间大致相同。 为了建立直觉:假设你路过一个间歇泉,看到一块牌子写着“此间歇泉上次喷发是在 10 万年前”。你对间歇泉一无所知。它在一小时内喷发的概率是多少?一定非常低,对吧?如果它在一小时内喷发,那你恰好在其喷发周期的 99.99999% 时刻路过——换句话说,你的随机样本值比 99.99999% 的点位都高。随机样本通常不会这样!另一方面,假设你路过另一个间歇泉,看到一块牌子写着“此间歇泉上次喷发是在 10 分钟前”。这个间歇泉在一小时内喷发的概率是多少?相当高,对吧?看来这个间歇泉的喷发间隔大概是几分钟量级。当你计算时,你对下一次喷发时间的预测中位数应该就是牌子上的数字。同样地,对于一个完全神秘的趋势改变形状所需的时间,你的预测中位数应该等于自上次改变以来经过的时间。 将此应用于 AI:那些试图深入理解 AI 进展动态的预测者认为,我们可以以当前速度继续扩展 AI 几年(例如通过建设更多数据中心),并且在此之后可能通过利用递归自我改进来加速。但假设你不信任这些人。你的默认假设应该是什么? 自至少 2017 年的 GPT-1 以来,AI 一直在显著改进,尽管大多数人或多或少将“缩放时代”任意定为 2019 年至今。因此,天真地讲,忽略我们所知的一切,将整个领域视为完全神秘,我们可能预期趋势平均再持续七年。假设服从帕累托分布(这在 AI 的情况下意味着什么?我不知道),那么趋势持续不到两年的概率是 22%。 嘲笑那些过度外推趋势的人是廉价且容易的: 但是,如果有人声称 AI 能力增强的趋势永远无法达到某个特定的可怕水平,那么举证责任就在于他们,需要解释以下两种情况之一: - 如果他们不是将 AI 视为黑箱,而是声称在显式地模拟其动力学,那么他们的模型是什么?他们是否计算了显而易见的事情,比如预计的数据中心增长和算法进步速度?他们是否熟悉该领域已有的建模工作,例如 AI 未来时间线模型 (https://www.aifuturesmodel.com/)?他们是否对其他人错在哪里、以及自己的模型有何不同有具体看法? - 如果他们*确实*将 AI 视为黑箱,为什么他们的默认预期不基于林迪定律?

相似文章

一张图看懂AI现状

Reddit r/artificial

一位新人观察到,AI讨论被“末日论”与“吹捧论”两极分化,质疑是否有人真正投入用户体验与小型模型系统设计,而非一味追求规模。

人工智能作为一种社会技术

Lobsters Hottest

本文批判了人工智能话语中持续存在的“奇点”叙事,主张应将当前的大语言模型作为一种社会技术来分析,而不是将其视为通往超智能的神秘路径。

@daniel_mac8: https://x.com/daniel_mac8/status/2054994899422826592

X AI KOLs Following

该讨论串指出,有最新证据表明AI代理已基本实现自主运作,其中Claude Mythos成功解决了此前未破解的网络攻击模拟实例,并超出当前基准测试测量极限,显示出超指数级进步。同时强调了安全影响及机构应对措施。