在五个模型上使用相同提示测试角色一致性

Reddit r/AI_Agents 2026/06/08 11:02 新闻

character-consistency video-generation model-comparison kling runway veo seedance pika

摘要

用户使用相同提示和参考图像，在五个AI视频生成模型（Kling 3.0、Runway Gen-4.5、Veo 3.1、Seedance 2.0、Pika）上测试角色一致性，发现Seedance 2.0最佳（8/10），Pika最差（3/10）。

厌倦了争论哪个模型最能保持角色一致性，所以我亲自测试了一下。相同提示、相同参考图像，每个模型生成10个片段，统计有多少能保持面部可识别。Kling 3.0：5/10。单镜头还行，但切换镜头时面部明显漂移。下颚结构变化，眼睛位置偏移。Runway Gen-4.5：6/10。比Kling好，但有几段中头发和肤色出现了变化。Veo 3.1：4/10。电影感很棒，但角色一致性显然不是他们目前优先考虑的。Seedance 2.0（CapCut视频工作室）：8/10。在远景、中景和特写中面部保持一致。有两个片段在发际线附近有轻微漂移，但不会破坏连贯性。Pika：3/10。喜欢Pika做特效和奇怪的东西，但如果需要同一角色出现两次，就别用这个了。当然这不是科学测试，但如果你工作流中需要保持一组“演员”，目前排序就是这样。如果想要看片段，我很乐意分享。

查看原文

在五个模型上使用相同提示测试角色一致性

相似文章

@Zephyr_hg：AI 现在第一次尝试就能给我完全想要的结果。测试了数千个提示词，发现每个有效的提示词中都存在相同的 5 个组件…

我用精神病提示词测试了4款前沿AI，一半未能通过。

提示工程能减少AI的谄媚行为吗？还是说这主要是模型行为问题？

我在 MLX 上使用同一个飞行模拟提示词测试了 9 个本地模型，全部均为 Q8 量化版本，但来自不同的量化提供商。

'一刀切'式AI时代已终结。我实测了GPT-5.5、Claude 4.7、Gemini 3.1 Pro和DeepSeek V4 Pro——以下是最新前沿格局。

提交意见反馈