@FinanceYF5: 《Gossip Goblin》可以说是世界上最顶级的 AI 电影创作者。 他的新电影《THE PATCHWRIGHT》堪称神作(播放量已超 1000 万)。 但一直没人知道这些作品究竟是怎么制作出来的。 每一步的工作流程

X AI KOLs Following 新闻

摘要

报道了AI电影创作者Gossip Goblin的新作《THE PATCHWRIGHT》播放量超千万,并即将揭秘其工作流程。

《Gossip Goblin》可以说是世界上最顶级的 AI 电影创作者。 他的新电影《THE PATCHWRIGHT》堪称神作(播放量已超 1000 万)。 但一直没人知道这些作品究竟是怎么制作出来的。 每一步的工作流程 🧵👇 https://t.co/c2wNUZV9Qp
查看原文
查看缓存全文

缓存时间: 2026/05/16 07:24

《Gossip Goblin》可以说是世界上最顶级的 AI 电影创作者。

他的新电影《THE PATCHWRIGHT》堪称神作(播放量已超 1000 万)。

但一直没人知道这些作品究竟是怎么制作出来的。

每一步的工作流程

2/这部 20 分钟的电影,他做了整整 4 个月。

而《The Patchwright》也不是从零开始。

过去 11 个月里,Zach 已经在这个世界观下持续更新内容,积累了数万张 Midjourney 图片、成熟角色,甚至自创语言。

很多人关注工具。

但真正厉害的,其实是他长期积累的世界观与故事体系。

3/视觉风格完全跟着剧情走。

电影从顶层豪宅一路下降到街头,因此他们按高度拆分场景:顶层、飞船、空中城市、街道、市场。

在用 Kling 动画前,每个场景都会先跑一轮 Midjourney 风格探索。

再用 Nano Banana,把统一角色植入这些“空镜头”里。

4/不要停留在 AI 的默认答案。

审讯室本可以只是“灰墙 + 桌子”的普通模板。

但他们把它做成了“环形监视空间”,顶部还有俯视结构。

随后再用 Nano Banana 混合粗野主义座椅参考图补细节。

因为 AI 给你的默认结果,也会给下一个上千人。

5/在这类创作里,Midjourney v7 依然强于 8.1。

Zach 认为 8.1 被“过度规整”了,而 v7 更接近 Midjourney 的真正上限。

但真正关键的,并不是 prompt 技巧。

而是长期打磨符合个人审美的 profile code,再结合 mood board 与风格参考。

那些真正有独特风格的创作者,基本都是这么做的。

6/Midjourney 负责探索视觉空间,Nano Banana 更像 Photoshop。

Zach 原话是:“没有任何图片会从 Nano Banana 开始,它只是我们的 Photoshop。”

Midjourney 能做出更极致的色彩、纹理和独特质感。

如果直接用 Nano Banana,你得到的往往只是它默认的视觉风格——更快,但也更普通。

7/先确定“核心镜头”,再补全中间内容。

每个场景里,他们都会先做几张确定光线与氛围的 hero shots。

确定后,再用 Nano Banana 补全其余镜头。

比如从顶层到街道的光线变化,并不是逐镜设计,而是从少数关键画面中自然延展出来的。

8/在动画开始前,颜色与氛围其实已经基本定型。

他们把湿货市场设定成“香港 × 曼谷 × 九龙夜市”的混合体:潮湿、混乱、雾气弥漫。

随后围绕这个概念建立专门的色彩与灯光参考。

最终,接近 90% 的调色效果,早就在静态画面里完成了。

9/真正高级的地方,是他们在“造世界”。

他刻意避开了日文汉字这类常见赛博朋克元素。

团队甚至专门设计了一套新字母系统,并参考缅甸文字做了辅助符号。

电影开场标题,还会从外星文字逐渐变形成他们自创的语言。

10/不要把任何细节交给“默认生成”。

《The Patchwright》里的茶壶、实验装置、福尔马林生物标本,甚至一闪而过的工作室纹理,都是专门设计的。

虽然大部分细节最终都没进入正片。

但正是这些看不见的投入,才让这个世界像“真实存在”,而不是 AI 随机生成。

11/角色部分几乎全是逐帧制作。

整个《The Patchwright》没有使用 multi-shot 或 omni-ref 这类自动连续镜头功能。

因为他想完全掌控画面中的一切。

这条最难的路,可能让他们多花了几个月。

但也正因此,这部电影才拥有了真正独特的风格。

12/角色一致性,不靠“一张设定图”。

他们会分别生成角色的近景、远景、背影等素材。

再用 Nano Banana 按镜头重新组合。

比如“角色从背后穿过市场”,其实是:背影素材 + 市场环境 + 其他角色 + prompt 的现场拼装。

每个镜头都重新搭建,而不是套模板。

13/在 Nano Banana Pro 出现前,他们甚至是“手工改图”。

那段 9 分钟的审讯戏里,团队会直接在图片上画箭头、标线、标动作。

再把修改图丢回 Nano Banana,继续生成下一镜。

上百个镜头,几乎都是这样一张张硬做出来的。

14/《The Patchwright》里所有能听清的台词,都是真人配音。

主角由一位美国前歌剧演员兼 DJ 配音,也是最初短片里的原班人马。

女性角色则通过英国选角网站寻找演员,很多配角直接由朋友客串。

ElevenLabs 确实方便。

但只要预算允许,真人表演带来的情绪与质感,依然不是 AI 配音能替代的。

15/《The Patchwright》的动画,几乎全部由 Kling 完成。

在这 4 个月高强度制作里,没有其他模型能达到 Kling 的细节、稳定性与控制力。

部分说话镜头,还会再用 Sync 做口型强化。

但 Sync Labs 实际操作很麻烦,往往需要先手动剪辑画面和音频,让波形尽量对齐,再让它补一点嘴部动作。

16/“AI 就像湿泥。”

Zach 说,AI 不会完全按你的想法运行。

你只能理解它、引导它,而不是绝对控制它。

真正的创作,更像是给模型正确输入,并接住那些“意外惊喜”。

17/AI 电影里最被低估的岗位,其实是剪辑师。

导演负责剧本、分镜与镜头。

但 AI 电影真正的统一感,往往是在剪辑阶段完成的。

一个熟悉 AI 缺陷的剪辑师,价值极高。

18/调色的核心,是“前期完成 90%,后期修最后 10%”。

大部分色调,在静态图阶段就已经确定。

后期更多只是统一镜头差异。

而 Zach 特别强调一点:绝不做超分辨率放大。

因为现在所有 upscaler,都会破坏纹理与原本的美感。

19/加颗粒感。

过去 grain 是为了遮 AI 瑕疵。

现在则是因为 AI 画面太干净、太蜡像感。

颗粒能带回粗粝感,让画面更像真实世界,而不是“被渲染出来的”。

20/声音,才是真正把一切粘合起来的东西。

Zach 会请真人音乐人制作关键段落配乐。

再叠加环境音、机械声、市场噪音与脚步声。

AI 音乐已经够用了。

但真正让 AI 片段变成“电影”的,是真人配乐 + AI 音乐 + 定制音效的组合。

21/最后的重点。

如今大家用的几乎都是同一批 AI 工具。

真正拉开差距的,从来不是模型。

而是你愿不愿意认真打磨那些“没人会注意”的细节。

一块标牌、一个杯子、角落里的生物标本。

99% 的人会跳过。

但正因为有人认真做了,它才像一个真实世界。

PJ的深度解析:

以上就是全部,原作者 @PJaccetturo

如果您喜欢这个主题:

1.关注我(@FinanceYF5) 2. 点赞+转发下面第一条帖子

相似文章