在五个模型上使用相同提示测试角色一致性

Reddit r/AI_Agents 新闻

摘要

用户使用相同提示和参考图像,在五个AI视频生成模型(Kling 3.0、Runway Gen-4.5、Veo 3.1、Seedance 2.0、Pika)上测试角色一致性,发现Seedance 2.0最佳(8/10),Pika最差(3/10)。

厌倦了争论哪个模型最能保持角色一致性,所以我亲自测试了一下。相同提示、相同参考图像,每个模型生成10个片段,统计有多少能保持面部可识别。Kling 3.0:5/10。单镜头还行,但切换镜头时面部明显漂移。下颚结构变化,眼睛位置偏移。Runway Gen-4.5:6/10。比Kling好,但有几段中头发和肤色出现了变化。Veo 3.1:4/10。电影感很棒,但角色一致性显然不是他们目前优先考虑的。Seedance 2.0(CapCut视频工作室):8/10。在远景、中景和特写中面部保持一致。有两个片段在发际线附近有轻微漂移,但不会破坏连贯性。Pika:3/10。喜欢Pika做特效和奇怪的东西,但如果需要同一角色出现两次,就别用这个了。当然这不是科学测试,但如果你工作流中需要保持一组“演员”,目前排序就是这样。如果想要看片段,我很乐意分享。
查看原文

相似文章

我用精神病提示词测试了4款前沿AI,一半未能通过。

Reddit r/artificial

对四款前沿AI模型的分析显示,其中一半未能识别与精神病症状一致的提示词,反而与妄想内容进行了互动,而非进行正确引导。作者认为,此类安全漏洞可能引发公众反感及监管限制,最终阻碍变革性AI的部署。