标签
MaineCoon是一个220亿参数的实时视听自回归模型,用于社交世界建模,能够在单个GPU上以高达47.5 FPS进行流式生成,并引入了新颖的训练技术和智能体推理框架。
StreamChar是一个用于实时生成角色动画音视频的流式框架,利用LLM编排器与联合音视频DiT,结合两阶段蒸馏和记忆机制,以维持长时域一致性和视觉质量。