@FinanceYF5: 《Gossip Goblin》可以说是世界上最顶级的 AI 电影创作者。 他的新电影《THE PATCHWRIGHT》堪称神作(播放量已超 1000 万)。 但一直没人知道这些作品究竟是怎么制作出来的。 每一步的工作流程
摘要
报道了AI电影创作者Gossip Goblin的新作《THE PATCHWRIGHT》播放量超千万,并即将揭秘其工作流程。
查看缓存全文
缓存时间: 2026/05/16 07:24
《Gossip Goblin》可以说是世界上最顶级的 AI 电影创作者。
他的新电影《THE PATCHWRIGHT》堪称神作(播放量已超 1000 万)。
但一直没人知道这些作品究竟是怎么制作出来的。
每一步的工作流程
2/这部 20 分钟的电影,他做了整整 4 个月。
而《The Patchwright》也不是从零开始。
过去 11 个月里,Zach 已经在这个世界观下持续更新内容,积累了数万张 Midjourney 图片、成熟角色,甚至自创语言。
很多人关注工具。
但真正厉害的,其实是他长期积累的世界观与故事体系。
3/视觉风格完全跟着剧情走。
电影从顶层豪宅一路下降到街头,因此他们按高度拆分场景:顶层、飞船、空中城市、街道、市场。
在用 Kling 动画前,每个场景都会先跑一轮 Midjourney 风格探索。
再用 Nano Banana,把统一角色植入这些“空镜头”里。
4/不要停留在 AI 的默认答案。
审讯室本可以只是“灰墙 + 桌子”的普通模板。
但他们把它做成了“环形监视空间”,顶部还有俯视结构。
随后再用 Nano Banana 混合粗野主义座椅参考图补细节。
因为 AI 给你的默认结果,也会给下一个上千人。
5/在这类创作里,Midjourney v7 依然强于 8.1。
Zach 认为 8.1 被“过度规整”了,而 v7 更接近 Midjourney 的真正上限。
但真正关键的,并不是 prompt 技巧。
而是长期打磨符合个人审美的 profile code,再结合 mood board 与风格参考。
那些真正有独特风格的创作者,基本都是这么做的。
6/Midjourney 负责探索视觉空间,Nano Banana 更像 Photoshop。
Zach 原话是:“没有任何图片会从 Nano Banana 开始,它只是我们的 Photoshop。”
Midjourney 能做出更极致的色彩、纹理和独特质感。
如果直接用 Nano Banana,你得到的往往只是它默认的视觉风格——更快,但也更普通。
7/先确定“核心镜头”,再补全中间内容。
每个场景里,他们都会先做几张确定光线与氛围的 hero shots。
确定后,再用 Nano Banana 补全其余镜头。
比如从顶层到街道的光线变化,并不是逐镜设计,而是从少数关键画面中自然延展出来的。
8/在动画开始前,颜色与氛围其实已经基本定型。
他们把湿货市场设定成“香港 × 曼谷 × 九龙夜市”的混合体:潮湿、混乱、雾气弥漫。
随后围绕这个概念建立专门的色彩与灯光参考。
最终,接近 90% 的调色效果,早就在静态画面里完成了。
9/真正高级的地方,是他们在“造世界”。
他刻意避开了日文汉字这类常见赛博朋克元素。
团队甚至专门设计了一套新字母系统,并参考缅甸文字做了辅助符号。
电影开场标题,还会从外星文字逐渐变形成他们自创的语言。
10/不要把任何细节交给“默认生成”。
《The Patchwright》里的茶壶、实验装置、福尔马林生物标本,甚至一闪而过的工作室纹理,都是专门设计的。
虽然大部分细节最终都没进入正片。
但正是这些看不见的投入,才让这个世界像“真实存在”,而不是 AI 随机生成。
11/角色部分几乎全是逐帧制作。
整个《The Patchwright》没有使用 multi-shot 或 omni-ref 这类自动连续镜头功能。
因为他想完全掌控画面中的一切。
这条最难的路,可能让他们多花了几个月。
但也正因此,这部电影才拥有了真正独特的风格。
12/角色一致性,不靠“一张设定图”。
他们会分别生成角色的近景、远景、背影等素材。
再用 Nano Banana 按镜头重新组合。
比如“角色从背后穿过市场”,其实是:背影素材 + 市场环境 + 其他角色 + prompt 的现场拼装。
每个镜头都重新搭建,而不是套模板。
13/在 Nano Banana Pro 出现前,他们甚至是“手工改图”。
那段 9 分钟的审讯戏里,团队会直接在图片上画箭头、标线、标动作。
再把修改图丢回 Nano Banana,继续生成下一镜。
上百个镜头,几乎都是这样一张张硬做出来的。
14/《The Patchwright》里所有能听清的台词,都是真人配音。
主角由一位美国前歌剧演员兼 DJ 配音,也是最初短片里的原班人马。
女性角色则通过英国选角网站寻找演员,很多配角直接由朋友客串。
ElevenLabs 确实方便。
但只要预算允许,真人表演带来的情绪与质感,依然不是 AI 配音能替代的。
15/《The Patchwright》的动画,几乎全部由 Kling 完成。
在这 4 个月高强度制作里,没有其他模型能达到 Kling 的细节、稳定性与控制力。
部分说话镜头,还会再用 Sync 做口型强化。
但 Sync Labs 实际操作很麻烦,往往需要先手动剪辑画面和音频,让波形尽量对齐,再让它补一点嘴部动作。
16/“AI 就像湿泥。”
Zach 说,AI 不会完全按你的想法运行。
你只能理解它、引导它,而不是绝对控制它。
真正的创作,更像是给模型正确输入,并接住那些“意外惊喜”。
17/AI 电影里最被低估的岗位,其实是剪辑师。
导演负责剧本、分镜与镜头。
但 AI 电影真正的统一感,往往是在剪辑阶段完成的。
一个熟悉 AI 缺陷的剪辑师,价值极高。
18/调色的核心,是“前期完成 90%,后期修最后 10%”。
大部分色调,在静态图阶段就已经确定。
后期更多只是统一镜头差异。
而 Zach 特别强调一点:绝不做超分辨率放大。
因为现在所有 upscaler,都会破坏纹理与原本的美感。
19/加颗粒感。
过去 grain 是为了遮 AI 瑕疵。
现在则是因为 AI 画面太干净、太蜡像感。
颗粒能带回粗粝感,让画面更像真实世界,而不是“被渲染出来的”。
20/声音,才是真正把一切粘合起来的东西。
Zach 会请真人音乐人制作关键段落配乐。
再叠加环境音、机械声、市场噪音与脚步声。
AI 音乐已经够用了。
但真正让 AI 片段变成“电影”的,是真人配乐 + AI 音乐 + 定制音效的组合。
21/最后的重点。
如今大家用的几乎都是同一批 AI 工具。
真正拉开差距的,从来不是模型。
而是你愿不愿意认真打磨那些“没人会注意”的细节。
一块标牌、一个杯子、角落里的生物标本。
99% 的人会跳过。
但正因为有人认真做了,它才像一个真实世界。
PJ的深度解析:
以上就是全部,原作者 @PJaccetturo
如果您喜欢这个主题:
1.关注我(@FinanceYF5) 2. 点赞+转发下面第一条帖子
相似文章
@FinanceYF5: AI 刚刚改变了电影创作的玩法 创作者现在已经可以用 100% AI 生成电影级短片、预告片和先导片了 8 个让人震撼的精选案例:
AI技术正在改变电影创作方式,创作者现可完全使用AI生成电影级短片、预告片和先导片,本文精选了8个令人震撼的案例。
@FinanceYF5: 1/ AI影视开始加速 Nate Tepper 宣布,TrueShort 融资 1200 万美元,要招募下一代电影创作者。 过去 10 个月,他们已做到 300 万美元年化收入、流媒体应用 Top 10、500 万+分钟观看时长。
AI影视公司TrueShort宣布融资1200万美元,计划招募新一代电影创作者,过去10个月已实现300万美元年化收入、流媒体应用Top 10及500万+分钟观看时长。
@FinanceYF5: 有人说这是他这几年来看过的最好的短片之一。 影片名称是 《Zombie Scavenger》,作者为 MX-Shell 很快,我们就不会再称它为‘AI影片’,而只是称它为‘影片’。
介绍由 MX-Shell 制作的短片《Zombie Scavenger》,被认为是近年来最好的短片之一,并指出 AI 视频正逐渐被接纳为常规影视作品。
@FinanceYF5: ChatGPT Images 2.0 刚刚上线。 大家都不敢相信这是 100% AI 生成的,效果强得离谱。 10 个炫酷案例: 1. Leon Lin分享“360° 等距长方投影图像”
OpenAI quietly released ChatGPT Images 2.0, impressing users with photorealistic 360° isometric equirectangular outputs showcased by Leon Lin.
@FinanceYF5: 《泰坦尼克号》影迷吵了快30年的问题,被 AI 用40秒“解决”了。 不是剪辑,不是恶搞,而是有人把自己放进原片场景里,直接改变剧情走向。 AI 视频真正可怕的地方:它开始让经典电影变成可互动素材。
AI视频技术让用户将自己插入《泰坦尼克号》场景并改变剧情,解决了影迷争论多年的问题,展示了AI将经典电影变为可互动素材的能力。