标签
一款韩国AI应用走红,它允许与AI角色进行逼真的视频对话,这些角色使用语音、唇形同步、面部表情和摄像头场景,标志着从文本界面到实时视频原生交互的转变。
Avataar AI推出Varya,这是一款针对印度规模和背景优化的视频生成模型,利用从Wan 2.2蒸馏的技术,实现了20倍成本降低和对本地细微差别的理解。
Netflix 发布了 VOID,一种视频修复模型,能够从视频中移除物体,同时逼真地模拟物理交互(例如,当移除一个人时,物体会掉落)。该模型基于 CogVideoX 构建,并通过交互感知的四元掩码条件进行微调。