韩国AI应用走红:可对话、反应并回应摄像头场景的AI角色
摘要
一款韩国AI应用走红,它允许与AI角色进行逼真的视频对话,这些角色使用语音、唇形同步、面部表情和摄像头场景,标志着从文本界面到实时视频原生交互的转变。
https://reddit.com/link/1ue5o4i/video/ozv6sohrc69h1/player
这款应用不仅允许与AI角色进行文字交流,还展示了能够通过语音、唇形同步、面部表情进行对话的角色,并在对话中回应摄像头场景。该演示表明,从基于文本的角色AI向视频原生AI角色转变,这种交互感觉更接近实时通话而非聊天机器人。对于机器学习开发者而言,有趣的部分在于底层技术栈:视觉、语音、记忆、虚拟角色动画、唇形同步以及低延迟编排,所有这些都需要实时协同工作。开放的问题是,这是否会成为娱乐AI的下一个界面,或者延迟和恐怖谷效应等问题是否会让文字聊天暂时保持主导地位。
相似文章
Mel AI 刚刚展示了一个视频原生 AI 角色的演示,这些角色能实时聊天、反应并响应摄像头上下文 [N]
Mel AI 展示了能够通过视频实时聊天、反应并响应视觉上下文的 AI 角色,超越了基于文本的角色聊天。
前谷歌Character AI时代正在演进
Mel AI正在将AI角色从基于文本的互动演变为实时视频聊天,具备唇同步、面部表情和摄像头上下文感知能力,这是在Character AI成功之后。
AI社交应用是否正从文字聊天转向实时视频交互?
讨论AI社交应用从文字聊天到实时视频交互的演变,重点介绍了Mel的多模态交互栈以及延迟、唇形同步和协调等技术挑战。
有没有人探索过AI视频智能体?这是新事物,但通过聊天机器人聊天来创建视频真的很有趣。
文章讨论了新兴的AI视频智能体概念,用户只需与聊天机器人对话即可生成完整视频,这可能简化并取代传统的多工具视频制作流程。
Labs AI
Labs AI 是一款能将文字转化为自然AI语音的iPhone应用。