能将任意图像转化为可玩幻觉的扩散模型!但本地运行,非数据中心

Reddit r/ArtificialInteligence 模型

摘要

一种扩散模型,能将任意图像转化为交互式可玩幻觉,在用户本地硬件上运行。

暂无内容
查看原文

相似文章

最强本地AI图像生成器来了!

YouTube AI Channels

Ernie Image,全新开源扩散模型,文字渲染与提示词忠实度全面超越Zage,可在ComfyUI本地运行,仅需约20 GB显存。

PiD:基于像素扩散的快速高分辨率潜在解码

Hugging Face Daily Papers

PiD 提出了一种像素扩散解码器,将潜在解码重新定义为条件像素扩散,从而在高分辨率下实现快速、高质量的图像合成,并降低计算需求。在消费级硬件上,它能在不到一秒内将潜在表示解码为 4 倍或 8 倍放大图像。

扩散模型中减少幻觉的分数控制

Hugging Face Daily Papers

本文介绍了方差引导的分数调制(VSM),通过控制分数函数的平滑度来减少扩散模型中的幻觉,在保持图像质量的同时实现了高达约25%的减少。