标签
unsloth 发布了基于百度的 ERNIE-Image-Turbo 模型的 GGUF 量化版本,采用 Unsloth Dynamic 2.0 方法,能够在配备 24GB 显存的消费级 GPU 上通过 8 步推理高效实现文生图。
Comfy-Org 将百度的 ERNIE-Image 和 ERNIE-Image-Turbo 模型重新打包以集成到 ComfyUI 中,提供了为 ComfyUI 基于节点的图像生成框架组织的即用模型文件。
Netflix 发布了 VOID,一种视频修复模型,能够从视频中移除物体,同时逼真地模拟物理交互(例如,当移除一个人时,物体会掉落)。该模型基于 CogVideoX 构建,并通过交互感知的四元掩码条件进行微调。
OpenAI 展示了改进的一致性模型训练技术,无需蒸馏即可实现高质量单步图像生成,通过新型损失函数和训练策略在 CIFAR-10 和 ImageNet 64×64 上取得显著的 FID 改进。