LLMs 将取代8-track复制工程师

Lobsters Hottest 新闻

摘要

一篇博客文章,探讨了为8-track磁带分割歌曲的NP-hard问题,并幽默地提出LLMs可以取代曾经手动解决这个问题的工程师,同时批评了在类似任务中使用Mechanical Turk工人。

<p><a href="https://lobste.rs/s/rcazen/llms_will_replace_8_track_duplication">评论</a></p>
查看原文
查看缓存全文

缓存时间: 2026/06/16 03:05

# LLMs 将取代 8 轨磁带复制工程师 来源:https://bbenchoff.github.io/pages/8Tracks.html 收藏的 8 轨磁带卡带 ## 人在工业级 NP 难划分问题上的表现 哥伦比亚唱片公司于 1948 年推出了 LP 格式,使听众每面黑胶唱片能获得 25 分钟的音乐。五十年来,每一张专辑(无论是黑胶还是卡带)都围绕着这个 50 分钟、两面的限制来制作。1965 年,8 轨磁带卡带改变了这一格式。8 轨磁带卡带是一段连续的循环磁带,带有四个轨道。要制作 LP 的 8 轨版本,唱片公司或磁带复制工厂的人必须将 LP 的曲目列表进行划分,使得四个轨道的长度尽可能相等。最长的轨道决定了卡带中磁带的长度。如果轨道 1 长 11 分钟,而轨道 2、3、4 只有 8 分钟,那么总共会有 9 分钟的静音。 这是一个经典的 NP 难问题,也是最简单的难题(https://www.americanscientist.org/article/the-easiest-hard-problem),而且是一个被无数不知名的音频工程师在没有计算机的情况下解决了成千上万次的问题。在 Discogs 和 MusicBrainz API 的深处,储存着专家在其领域内解决 NP 难问题的人类表现数据。 前沿实验室仍在以每小时几美分的价格雇佣 Mechanical Turk 工人,而他们本可以沉迷于一种已经消亡了四十年的音乐格式。我为他们感到惋惜。 如果你好奇,我正打算在我的车里装一个 8 轨磁带播放器(https://bbenchoff.github.io/pages/Citicar.html),并且我想要一张 Frank Ocean 的 *Blonde*。然后我开始思考。接着我意识到 Girls 的 *Broken Dreams Club* 的 8 轨版本是不可能的。于是我们来到了这里。 Frank Ocean *Blonde* 8 轨磁带卡带 ## 问题 8 轨磁带卡带是一段连续的循环磁带,上面并行录制了四个“轨道”。播放器按顺序播放它们,每次通过结尾时物理移动磁头——由于所有四个轨道共享同一个循环,**所有四个轨道的长度完全相同**。最长的轨道决定了磁带的物理长度;每个较短的轨道在剩余部分播放空白。浪费的磁带会增加复制商的成本。将歌曲跨轨道分割会破坏歌曲的流畅性。看看 Harvest 发行的 *Dark Side of the Moon*(https://www.discogs.com/release/1905270-Pink-Floyd-The-Dark-Side-Of-The-Moon);“Money”被分割在轨道 2 和 3 之间。“Us and Them”被分割在轨道 3 和 4 之间。它保留了 LP 的曲目顺序,但代价是破坏了专辑中最佳歌曲的氛围。 对于每一张 8 轨磁带发行,复制厂的某个人必须将歌曲分成四组,使总时长尽可能平衡。这是平衡的 4 路数字划分,是一个通过秒表或纸笔手工解决的 NP 难优化问题。以下是一个做得好的例子。*Rumours*——Fleetwood Mac,WEA,1977 年——共 11 首歌曲,发行时的划分如下: 轨道 1 | 10:07 1. Second Hand News 2:54 2. Oh Daddy 3:58 3. I Don't Want To Know 3:15 轨道 2 | 10:06 1. Dreams 4:18 2. Never Going Back Again 2:15 3. You Make Loving Fun 3:33 轨道 3 | 10:17 1. Don't Stop 3:14 2. Go Your Own Way 3:40 3. Songbird 3:23 轨道 4 | 9:33 1. The Chain 4:31 2. Gold Dust Woman 5:02 这不是 LP 的播放顺序。它**远远不是** LP 的播放顺序。负责这张 8 轨磁带的工程师**非常接近**最优解,但因为我们现在有了可以搜索所有排列的计算机,我可以告诉你 *Rumours* 的最佳 8 轨磁带排列: 轨道 1 | 10:13 1. Dreams 4:18 2. Never Going Back Again 2:15 3. Go Your Own Way 3:40 轨道 2 | 10:10 1. Don't Stop 3:14 2. Songbird 3:23 3. You Make Loving Fun 3:33 轨道 3 | 10:07 1. Second Hand News 2:54 2. I Don't Want To Know 3:15 3. Oh Daddy 3:58 轨道 4 | 9:33 1. The Chain 4:31 2. Gold Dust Woman 5:02 在**理想**排列与发行排列之间唯一的区别是,将“Go Your Own Way”与“You Make Loving Fun”进行了交换。这样可以节省 4 秒的磁带。8 轨磁带运行速度为 3.75 英寸/秒,因此假设 *Rumours* 的 8 轨版本生产了 100,000 张,这一小小的改动将节省**23 英里**的磁带。 ### 优化 8 轨磁带的经济性 这大概是我能找到的 1/4 英寸润滑磁带(Scotch 158 或 Ampex 675)的历史价格的最佳来源(https://www.tapeheads.net/threads/historical-prices-of-open-reel-v-cassette-tape.11180/)。成本约为每英尺 0.003 美元。将 *Rumours* 放在 8 轨磁带上的幼稚解决方案(LP 曲目顺序)与实际发货的近乎最优方案相比,每个卡带节省了 62 秒,或者在 100,000 张卡带的生产中节省了 **5,812.50 美元**。将 *Rumours* 放入 8 轨磁带的工程师通过几小时的工作为雇主节省了几个月的工资。 通过将“Go Your Own Way”与“You Make Loving Fun”交换来进一步优化 *Rumours*,可以再节省 4 秒。100,000 张卡带所需的磁带成本约为 400 美元,略高于复制工程师一周的工资。 所有这一切都是用铅笔和纸完成的。也许用了计算器。我预期我的下一个项目将编写一个 Apple II Basic 程序,该程序将搜索所有排列,为每张 LP 到 8 轨磁带的转换找到最优解。在 Apple II 上,测试所有排列的任务需要几天时间。 ## 语料库 本探索中的每一点数据都来自两个来源。Discogs(https://www.discogs.com/)对于所有过度支付的千禧一代“计算机工作者”来说都很熟悉,无需介绍。MusicBrainz(https://musicbrainz.org/)是每张发行版所有元数据的百科全书。对于我通过 Discogs 找到的每张 8 轨磁带,我提取了曲目排列,然后从 MusicBrainz 中提取了每首歌曲的长度,以及 LP 的曲目排列。构建这个数据库是一个巨大的漏斗: - 处理了 51,197 张 Discogs 上的 8 轨磁带发行,基本上涵盖了 Discogs 上的所有 8 轨磁带。 - 其中 13,045 张(25%)与 MusicBrainz 上 LP/CD 发行的每首歌曲时长清晰关联。 - 其中 8,266 张具有明确的四轨道结构,并且可以计算人类解的 makespan。 - 去重后得到 **6,463** 个独特的解——同一母版、同一复制商和相同的轨道布局只计一次,但同一专辑的不同发行版本保留。 是的,这只是我能找到的所有 8 轨磁带卡带的 12%,但这完全真实。数据集中不包含 Columbia House 的 8 轨独家合辑,我也不关心那些从未被刻录成黑胶的宗教布道 8 轨磁带。这是一个关于人类解决 8 轨磁带划分问题的数据集,而不是过去所有与 1/4 英寸磁带相关的事件的目录。 你可以在项目的仓库中获取完整数据集:https://github.com/bbenchoff/8-track-partitions/ ## 结果 在展示任何结果之前,我想举例说明人类是如何解决这个问题的。滚石乐队的 *Sticky Fingers* 有十个不同的 8 轨版本: ### 滚石乐队 — *Sticky Fingers*(1971) 复制商 | 轨道(按磁带顺序的曲目) | makespan Atlantic Recording、Kinney Music、Melody Recordings、Rolling Stones | **P1(11:39)**——Brown Sugar, Sway, I Got The Blues **P2(11:39)**——Wild Horses, Moonlight Mile **P3(11:21)**——Can't You Hear Me Knocking, Dead Flowers **P4(11:46)**——You Gotta Move, Bitch, Sister Morphine | 11:46 Quala Sonic | **P1(11:46)**——You Gotta Move, Bitch, Sister Morphine **P2(11:39)**——Moonlight Mile, Wild Horses **P3(11:39)**——Brown Sugar, Sway, I Got The Blues **P4(11:21)**——Dead Flower, Can't You Hear Me Knocking | 11:46 WEA/Warner | **P1(11:32)**——Brown Sugar, Sway, Wild Horses (Début / Begin) **P2(11:33)**——Wild Horses (Fin / End), Can't You Hear Me Knocking, You Gotta Move **P3(11:39)**——Bitch, I Got The Blues, Sister Morphine (Début / Begin) **P4(11:38)**——Sister Morphine (Fin / End), Dead Flowers, Moonlight Mile | 11:39 Sound Values Marketing | **P1(11:55)**——Wild Horses, You Gotta Move, Bitch **P2(11:39)**——Brown Sugar, Sway, I Got The Blues **P3(11:30)**——Sister Morphine, Moonlight Mile **P4(11:21)**——Dead Flowers, Can't You Hear Me Knocking | 11:55 Sicamericana Sacifi | **P1(11:18)**——No Puedes Escucharme Golpear = Can't You Hear Me Knocking, Flores Muertas = Dead Flowers **P2(11:40)**——Caballos Salvajes = Wild Horses, Una Milla A La Luz De La Luna = Moonlight Mile **P3(11:34)**——Tengo Blues = I Got The Blues, Azúcar Marrón = Brown Sugar, Balanceo = Sway **P4(12:01)**——Debes Correrte = You Gotta Move, Perra = Bitch, Hermana Morfina = Sister Morphine | 12:01 Rolling Stones | **P1(11:21)**——Can't You Hear Me Knocking, Dead Flowers **P2(11:30)**——Moonlight Mile, Sister Morphine **P3(12:10)**——Wild Horses, Sway, You Gotta Move **P4(11:24)**——Brown Sugar, Bitch, I Got The Blues | 12:10 Not On Label The Rolling Stones | **P1(12:19)**——Brown Sugar, You Gotta Move, Moonlight Mile **P2(11:19)**——Wild Horses, Sister Morphine **P3(11:26)**——Sway, Bitch, I Got The Blues **P4(11:21)**——Can't You Hear Me Knocking, Dead Flowers | 12:19 Sound Ventures 2 | **P1(11:22)**——Brown Sugar, Sway, Bitch **P2(11:19)**——Wild Horses, Sister Morphine **P3(11:11)**——Can't You Hear Me Knocking, I Got The Blues **P4(12:33)**——You Gotta Move, Dead Flowers, Moonlight Mile | 12:33 Br 8 | **P1(13:28)**——Bitch, I Got The Blues, Moonlight Mile **P2(9:40)**——Sister Morphine, Dead Flowers **P3(9:49)**——Can't You Hear Me Knocking, You Gotta Move **P4(13:28)**——Brown Sugar, Sway, Wild Horses | 13:28 Pieces O Eight | **P1(19:23)**——Wild Horses, Moonlight Mile, Brown Sugar, Sway **P2(19:02)**——Sister Morphine, Bitch, You Gotta Move, Can't You Hear Me Knocking **P3(3:55)**——I Got The Blues **P4(4:05)**——Dead Flowers | 19:23 在最上方,四家不同的厂牌——Atlantic、Kinney、Melody 和滚石自己的厂牌——独立找到了可证明的最优划分。WEA/Warner 通过尊重 LP 的原始曲目顺序并将“Wild Horses”和“Sister Morphine”各分成两半,节省了 7 秒磁带。其他复制商表现也不错,除了 Pieces O Eight(https://www.discogs.com/label/1827997-Pieces-O-Eight),这是一个盗版厂牌。 ### 风格流派 不同制作工厂在处理这个问题时存在差异。当找不到完美划分时,基本有两种选择:跨轨道分割一首歌曲,或者重复一首短歌来填满磁带。以下是不同复制商的做法表格,仅限于同一 LP 被 2 家或更多厂牌复制的情况: 复制商 | n | 分割百分比 | 重复百分比 | 在有争议的专辑上的分割百分比 Hardman Industries | 43 | 53.5 | 9.3 | — Precision | 170 | 50.6 | 7.6 | **70%** Capitol | 349 | 50.4 | 0.6 | **58%** Polydor | 51 | 49.0 | 0.0 | — Apple | 31 | 48.4 | 0.0 | — Solo Products | 76 | 46.1 | 6.6 | — GRT | 335 | 44.8 | 3.3 | 44% Columbia/CBS | 641 | 42.3 | 6.7 | 38% Atlantic Recording | 76 | 42.1 | 1.3 | — PolyGram | 55 | 36.4 | 5.5 | — Club | 39 | 33.3 | 12.8 | — Audio Devices | 70 | 32.9 | 8.6 | — RCA | 438 | 28.8 | 7.8 | **71%** MCA | 53 | 26.4 | 37.7 | — WEA/Warner | 239 | 24.7 | 5.0 | 40% Lear Jet | 51 | 23.5 | 5.9 | — A&M Limited | 73 | 21.9 | **41.1** | — Ampex | 474 | 15.2 | 23.8 | **31%** Quality Limited | 51 | 3.9 | 15.7 | — ITCC | 55 | **0.0** | 27.3 | — Capitol 分割了一半的磁带,几乎不重复(50.4% 对比 0.6%);Apple 和 Polydor 从未重复过任何一首歌。在另一端,ITCC 分割了**零**张磁带(共 55 张),重复了 27% 的磁带,而 Ampex 和 A&M Limited 也倾向于同样的方式——当数学上无法平衡时,他们选择用重复的短歌来填充,而不是对长歌动刀。同样的问题,相反的工具。 ## 工程师的风格 以上很好地展示了这些数据能告诉我们关于划分问题的“风格流派”,但这并没有回答一个问题:**人类解决这个问题的水平有多高?**为此,我们将工程师的划分与几个指标进行比较。首先,保持专辑顺序。其次,LPT(https://en.wikipedia.org/wiki/Longest-processing-time-first_scheduling),标准贪婪算法,发表于 1960 年代。第三,Karmarkar–Karp 差分法(https://en.wikipedia.org/wiki/Largest_differencing_method),或 KK 算法,或 LDM。这是一种划分算法,首次发表于 1982 年。最后,因为我有一台在过去 20 年内制造的计算机,我可以简单地遍历所有可能的解来找到最优解。 *Rumours* 的 8 轨版本 再次以 *Rumours* 为例。它以 LP 形式发行,我们可以确定不同算法所需的磁带长度: 方法 | 轨道(曲目) | makespan 保持专辑顺序*(最佳分割)* | **P1(9:27)**——Second Hand News, Dreams, Never Going Back Again **P2(10:17)**——Don't Stop, Go Your Own Way, Songbird **P3(11:19)**——The Chain, You Make Loving Fun, I Don't Want To Know **P4(9:00)**——Oh Daddy, Gold Dust Woman | 11:19 LPT(https://en.wikipedia.org/wiki/Longest-processing-time-first_scheduling)*(贪婪)* | **P1(10:52)**——Don't Stop, Go Your Own Way, Oh Daddy **P2(10:45)**——Second Hand News, Dreams, You Make Loving Fun **P3(10:09)**——Never Going Back Again, Songbird, The Chain **P4(8:17)**——I Don't Want To Know, Gold Dust Woman | 10:52 Karmarkar–Karp(https://en.wikipedia.org/wiki/Largest_differencing_method)*(1982)* | **P1(10:35)**——Second Hand News, Dreams, Songbird **P2(10:27)**——Don't Stop, I Don't Want To Know, Oh Daddy **P3(10:19)**——Never Going Back Again, The Chain, You Make Loving Fun **P4(8:42)**——Go Your Own Way, Gold Dust Woman | 10:35 WEA 的工程师*(1977)* | **P1(10:17)**——Don't Stop, Go Your Own Way, Songbird **P2(10:07)**——Second Hand News, I Don't Want To Know, Oh Daddy **P3(10:06)**——Dreams, Never Going Back Again, You Make Loving Fun **P4(9:33)**——The Chain, Gold Dust Woman | 10:17 可证明的最优解*(自由混排)* | **P1(10:13)**——Dreams, Never Going Back Again, Go Your Own Way **P2(10:10)**——Don't Stop, Songbird, You Make Loving Fun **P3(10:07)**——Second Hand News, I Don't Want To Know, Oh Daddy **P4(9:33)**——The Chain, Gold Dust Woman | 10:13 这个表格有一个注意事项,我之前应该明确说明:轨道是可以互换的(你可以交换轨道 1 和轨道 3,结果不变),并且轨道内的歌曲顺序也是可以互换的。轨道 4 中是 *The Chain* 在前还是 *Gold Dust Woman* 在前没有区别。 给定相同的曲目列表,每种算法产生不同的结果。LPT 的表现并不比幼稚的“复制 LP 曲目顺序”解决方案好多少。LPT 和 KK 都有一个短轨道——这些算法的失败模式。人类工程师只差一个交换就达到最优解。 无论如何,我们可以看到,对于 *Rumours*,人类的表现很好。非常好。甚至比这个排列制定十年后才发明的算法还要好。这个观察结果是否适用于整个 8 轨磁带卡带语料库?令人惊讶的是,是的。 ## 人类在计算机问题上的表现 在全部 6,463 个解中,中位数工程师仅比可证明的最优解多出 5 秒——在一张大约 40 分钟的专辑上,误差仅为 0.2%。更关键的是:我用来评分的时长本身也大约只有三到四秒的精度,因为 LP 和 CD 版本与 8 轨母带会相差几秒(我测量过)。所以典型的工程师并非离完美只有 5 秒,而是已经达到了这些数据能够分辨的地板。超过四分之一的磁带(27.5%)精确达到了最优解:在数千种排列中手动找到的最佳那一种。 ### 人类 vs LPT vs Karmarkar–Karp - 人类 vs LPT:赢 3192(58%),平 714(13%),输 1569(29%)(n=5475) - 人类 vs KK:赢 2541(46%),平 861(16%),输 2073(38%)(n=5475) 他们也击败了教科书。在相同的时长下重新评分,人类在 58% 的磁带上击败了贪婪的 LPT,输了 29%——超过两比一。面对 Karmarkar–Karp,人类在 46% 的磁带上取胜,输了 38%

相似文章

引用布莱恩·坎特里尔

Simon Willison's Blog

布莱恩·坎特里尔批评LLM缺乏人类懒惰带来的优化约束,认为LLM会不必要地使系统复杂化而非改进,并强调人类时间限制推动了高效抽象的发展。

LLM的有效用例

Lobsters Hottest

本文分享了LLM在软件工程中的实际应用案例,包括通过RAG搜索客户对话、从日志中排查API故障以及内容精简。重点强调了效率提升和减少手动筛选工作。

LLMs 并非你所认为的黑箱

Hacker News Top

一篇总结 Anthropic 2025 年关于机制可解释性论文的文章,表明 LLM 并非黑箱,电路追踪可以揭示多步推理和人类可识别的概念。

LLMs 现在变得复杂了

Hacker News Top

文章讨论了LLMs如何变得越来越复杂,从简单的Transformer堆栈演变为融入多种注意力变体、混合专家模型和多模态编码器,与推荐系统进行了类比,并强调了像FlexAttention这样可组合内核优化的必要性。