设计一款更好的播客编辑器

Lobsters Hottest 产品

摘要

Adam Solove 介绍了他自己开发的播客编辑器 Ducking,该编辑器具备磁性时间轴、多人协作编辑以及专为口语音频工作流设计的协作工具。这篇文章深入探讨了 UI 设计决策,展示了相比传统 DAW 交互模型在播客编辑方面的改进。

<p><a href="https://lobste.rs/s/axxclh/designing_better_podcast_editor">评论</a></p>
查看原文
查看缓存全文

缓存时间: 2026/06/05 02:15

# 设计更好的播客编辑器 — Adam Solove 来源:https://www.adamsolove.com/ui/ducking/2026/06/03/better-podcast-ui.html 过去几年,我的伴侣一直在录制和剪辑一档小众播客,我则在音乐选择和均衡器设置方面提供一些协助。我们的工作流程相当痛苦:共用一个 iCloud 文件,通过邮件互发附有时间戳的修改意见,还要小心翼翼地确认彼此的改动没有冲突。 **编辑音频就像回到二十年前:没有修订追踪,没有批注,也没有多人协同编辑。** 麻烦不仅仅出在以文件为中心的工作流程上。数字音频工作站(DAW)的常规交互模式,其实并不特别适合编辑口语音频这项任务。 于是,我决定亲手打造我们想要的播客编辑器:**Ducking**。它拥有专为口语音频布局而设计的 UI,同时具备多人协同编辑、协作工具和历史记录管理功能。本文将重点介绍它在编辑工具方面的改进。后续文章将探讨多人音频编辑的工程挑战,以及借助设计草图技术和 LLM 辅助、只为少数用户打造软件的乐趣。 *Ducking 截图——波形时间轴、文字稿面板、历史面板,以及分布在不同片段上的两个游标。Ducking 使用中的截图,已打开评论和效果面板。* Ducking 如何让播客编辑变得更轻松?它专注于为两项最常见的重复性任务提供更好的工具: - **音频布局**:指定各音频片段在周围内容发生变化时应如何衔接。 - **导航**:找到正确的音频片段。这涉及多个精度层级,从"第二幕大概从哪里开始?"到"那段背景噪音精确到哪一毫秒开始?" Ducking 本身是专为我们的播客工作流程而构建的,也确实满足了这一需求,短期内不会公开发布。**但我希望其中一些想法能够传播到其他工具中,发挥更广泛的价值。** 在本文中,我将通过简化的动画演示各项功能,以避免其他编辑界面元素的干扰。 ## 音频布局 与报纸或网页排版类似,音频编辑的主要挑战之一是:先大致尝试各部分如何拼合,再精确细化,同时不破坏已有的安排。 Ducking 提供了一种更高效的音频布局概念模型,借鉴了其他 DAW、文本编辑器乃至更广泛领域的思路。 ### 从绝对时间到磁性时间 在传统 DAW 中,每个片段都有一个绝对的起始时间。一旦某个片段被移动或长度发生变化,其后的所有内容都会错位。 *绝对布局——裁剪任意片段都会留下静音间隙,或与下一个片段重叠。* 绝对布局适合作曲,因为某个小节的内容就应该待在那里。但对于口语音频编辑来说,这是错误的模型——默认情况下,前面的内容改变时,后面的内容应该自动重排。 正确的布局模型是**磁性时间轴**:片段是有顺序的,而非固定在某个位置。每个片段在时间轴上的位置,由其前面所有内容的时长累加计算得出。因此,当某个片段被添加、删除或编辑时,后续所有内容会自动重排。 间隔片段则允许在需要时插入明确时长的静音。 *磁性布局——裁剪时,片段和间隔会自动重排。* 许多视频编辑工具以及专注于口语内容的音频工具(如 [Hindenburg](https://hindenburg.com/))都采用了这一模型。这个概念本身并不新鲜。**但它奠定了第一步,也启示我们:进一步探索自动化布局模型或许大有裨益。** ### 从分割到跳过区域 播客编辑的绝大部分工作,是反复删除不需要的片段,例如语气词、过长的停顿或说错的句子。在大多数音频编辑器中,这意味着要把录音片段切成很多小段,再逐一调整对齐。操作几十次之后,时间轴视图就会变成一大堆零散片段,难以浏览或重新整理。 *没有跳过区域时,每次删除语气词都会把片段一分为二。再多几刀,就会产生十几个互不相连的碎片——而且看不出它们原本属于同一段录音。* Ducking 采用"**跳过区域**"作为更好的解决方案。编辑器可以将一个片段保持为单一整体,同时将其中不需要的部分标记为跳过,而无需真正切割。这样,一段基本完整的录音依然是一个独立单元,更易于理解和重新排列,同时也能清楚地标示哪些内容已被移除。 *跳过区域——折叠片段的某一部分,而不将其一分为二。* 跳过区域的作用类似于文本编辑器中的代码折叠。它留下可见的标记,并且可以展开,以便与跳过的音频交互或调整区域的起止点。 ### 基于锚点的对齐 到目前为止,编辑器只处理单轨音频。一旦加入更多并行轨道,问题就会变得复杂。 最棘手的情形莫过于过渡音乐:编辑通常希望音乐在前一段的结尾轻柔地垫底,随后音量渐强成为主角,再在下一段开始时重新淡出至背景。 大多数音频工具允许以两种方式布局第二轨:绝对时间,或将一轨中某个片段的起点与另一轨的特定位置相连,使第二轨能随磁性时间轴一起浮动。 *单一连接点——音乐片段绑定到某段语音片段的结尾。* 使用连接点模型,编辑可以构建出任意特定的过渡效果,但需要费力地在创作意图和实现工具之间来回转化。 分析编辑者真正想做的创作决策,他们其实关心的是: - 音乐淡入部分与上一段语音的对应关系:确保音乐在这一段达到戏剧性或总结性高潮时恰好变得明显。 - 音乐高潮部分如何让上一段温柔地淡出,以及音乐如何呼应两段之间的情感或内容转换。 - 音乐淡出部分如何重新降低音量,融入下一段口语内容之下,稍作停留,再平滑地淡出。 因此,我构建了一套与这些创作决策精确对应的布局工具。使用基于锚点的布局系统,编辑可以自由选择音乐的哪个部分应与前后语音片段的哪个部分同步播放,然后独立控制每轨的音量或其他效果,使它们层次分明地叠加在一起。 *锚点与约束——双绑定约束布局,带有淡入淡出点和自动化控制。* 将磁性时间轴、跳过区域和轨道间约束这些元素结合在一起,便能从音频编辑中剔除繁琐的布局操作,让编辑者直接专注于他们想要实现的情感体验。 ## 音频导航 在执行任何编辑操作之前,编辑者必须先理解并选定要编辑的内容。音频导航通常通过以下几种方式进行: - **实际聆听**音频,可能包括拖拽或跳转时间轴。播放头在时间轴上提供当前播放位置的可视对应。一个常见操作是边听边在合适的位置暂停,将播放头留在目标位置。 - **查看时间轴和波形**有时也很有帮助,无论是高度缩小时(片段和轨道的排列模式呈现出项目的整体结构),还是高度放大时(波形精确显示某段语音或声音的起始位置)。 - **查看文字稿**在中间层级上很有帮助,适合寻找某段特定的语音内容。 Ducking 的 UI 通过建立各种视图之间的对应关系,使任意一种导航方式都变得顺畅。将时间轴编辑工具旋转 90°,使得概览、波形和文字稿视图都沿同一方向排列,并能同步滚动。 以下是一个低保真交互原型,展示了其核心思路。 *在项目中滚动。时间轴、文字稿和概览缩略图保持同步——金色播放头在三个视图中同时标记当前位置。* 这一整体 UI 布局带来以下优势: - **滚动条**显示整个项目的简化缩小概览,因此滚动滑块的大小和位置能精确反映我们在项目中的位置以及当前的缩放比例。在这个项目中,紫色的音乐片段清晰地标示出各段落的分界,让我们一眼就能看出当前正处于引言到第一主要段落的过渡处。 - **时间轴视图**以传统波形方式呈现各轨道和片段的编辑工具,但旋转了 90°,改为垂直滚动。这样既能对波形进行精细的 DAW 编辑操作,又能自然地与文字稿对齐。 - **文字稿视图**既不是事后附加的(像大多数 DAW 那样,文字稿只是单独存在,与其他编辑操作毫无关联),也不是主要编辑界面(如 Descript 那样)。它与时间轴同步滚动和缩放,让你始终能清楚地看到正在编辑的音频对应的文字。点击某个词,播放头就会跳转到该位置。 这一 UI 布局在概览、波形、文字稿和当前播放音频之间建立了清晰的对应关系: - **播放头**以金色线条同时出现在三个视图中,始终标示当前正在收听的位置。 - 时间轴视图当前显示的内容,在概览中通过滚动滑块标示,在文字稿视图中通过匹配的灰色轮廓区域标示。 - 滚动和缩放操作显然同时作用于三处。 这种对应关系还放大了其他工具的能力。在搜索文字或查看项目编辑历史时,相关标注可以叠加显示在三个视图上。 举个例子:由于概览始终显示整个项目,它非常适合用于了解整体结构,并在文档中快速定位搜索结果或追踪的变更所在位置。 *同一个滚动条,三种用途。概览提供全项目上下文,让搜索、历史对比等工具共享同一套交互方式。* ## 结语与后续计划 综合来看,更强大的音频布局模型和全新的 UI 导航,让我们能更高效地从原始录音中制作播客节目。这款软件确实是为我们自身的需求量身定制的,但这些想法或许有更广泛的适用价值,这也是我在此分享它们的原因。 本文聚焦于 UI 层面,我计划后续再发布两篇文章,探讨项目的其他方面: 1. 基于 Automerge 构建本地优先多人协作体验的过程,尤其关注针对非文本数据的协作与变更管理方面的思考。 2. 在非商业环境中与 AI 编程助手合作的体验——不是用它来加速工作,而是用它为自己争取更多草图构思和悠闲思考的时间。以及打造只需让两个人满意的"窄播"软件所带来的乐趣。 --- ## 关于我 我是 Adam Solove,一名热衷于在复杂领域构建优秀产品的产品工程师。我刚刚结束了为期六个月的休假,期间专注于本地社区事务,以及像上述这样充满个人色彩的技术实验。 我正在寻找新的项目合作或下一份职位机会。如果你在做一些有趣的事情,欢迎[联系我](mailto:[email protected])。

相似文章

Knooth

Product Hunt

Knooth 是一款全新的 macOS 应用程序,具备利用 AI 为屏幕录制视频进行编辑的功能。