image-generation

标签

Cards List
#image-generation

基于信息论的无分类器引导与自适应调度优化

arXiv cs.LG · 昨天 缓存

提出了一种基于信息论的框架,用于优化扩散模型中的无分类器引导调度,在ImageNet和COCO基准上实现了条件一致性与样本多样性之间更优的权衡。

0 人收藏 0 人点赞
#image-generation

DiffusionBench:迈向生成式扩散变换器的全面评估

Hacker News Top · 昨天 缓存

介绍了DiffusionBench,这是一个统一的基准,用于全面评估生成式扩散变换器,支持多种生成任务,并提供标准化的训练与评估。

0 人收藏 0 人点赞
#image-generation

Krea 2 技术报告 (59分钟阅读)

TLDR AI · 昨天 缓存

Krea 2 是一系列用于创意图像生成的基础模型,构建于大规模数据基础设施和多阶段训练流程之上。它引入了提示扩展器和风格参考系统,以提高可操控性并实现创意探索。

0 人收藏 0 人点赞
#image-generation

Krea 2 在 Hugging Face 上发布

Reddit r/LocalLLaMA · 昨天 缓存

Krea 2 是一个拥有120亿参数的文本到图像扩散模型,以开放权重形式在 Hugging Face 上发布,提供了 Raw(基础版)和 Turbo(后训练版)检查点。

0 人收藏 0 人点赞
#image-generation

内容写作、逼真图像生成和氛围编码的最佳低价模型是什么?

Reddit r/AI_Agents · 昨天

询问关于用于内容写作、图像生成和氛围编码的平价AI模型的推荐。

0 人收藏 0 人点赞
#image-generation

Boogu Base、Turbo、Edit —— 开源统一图像生成与编辑模型系列

Reddit r/LocalLLaMA · 2天前

Boogu 发布了一系列开源统一图像生成与编辑模型,包括 Base、Turbo 和 Edit 变体。

0 人收藏 0 人点赞
#image-generation

DiffusionBench:扩散变换器的全面评估

Hugging Face Daily Papers · 2天前 缓存

研究人员引入了NanoGen,一个用于训练和评估扩散变换器的统一框架,并提出了DiffusionBench,一个结合了ImageNet类别条件和文本到图像生成的全面基准,以更好地评估生成建模的进展。

0 人收藏 0 人点赞
#image-generation

Semantic Browsing: 图像生成中的可控多样性

Hugging Face Daily Papers · 3天前 缓存

Semantic Browsing 引入了一种方法,通过使用一个 Vision Language Model 和代理工作流,在文本到图像生成中实现基于语义决策的结构化、可解释的可控多样性。

0 人收藏 0 人点赞
#image-generation

本地文本到图像模型对比:终极测试。

Reddit r/LocalLLaMA · 3天前

用户使用192个提示词对本地文本到图像模型进行了全面对比,评估了文本渲染、人脸、人体解剖、空间构图等能力,结果和提示词已在imagebench.ai上公开。

0 人收藏 0 人点赞
#image-generation

我从头开始预训练和后训练了一个500M参数的LLM和一个330M参数的图像生成器

Reddit r/LocalLLaMA · 3天前

作者详细介绍了从头开始预训练和后训练一个500M参数的语言模型和一个330M参数的图像生成器的过程。

0 人收藏 0 人点赞
#image-generation

Thumbmagic

Product Hunt · 4天前

Thumbmagic 是一个AI缩略图生成器,基于表现最佳的缩略图训练。

0 人收藏 0 人点赞
#image-generation

@cellinlab: 卧槽!秒啊!我怎么就没想到这个用法 用 内嵌浏览器 做 Codex Image 2 的生图无限画布!

X AI KOLs Timeline · 5天前 缓存

发现一个创意用法:利用内嵌浏览器实现Codex Image 2的无限画布生图。

0 人收藏 0 人点赞
#image-generation

给我本地LLM智能体添加了MCP工具用于本地图像+视频生成,因此它在我要求时就能生成(完全离线+免费)

Reddit r/LocalLLaMA · 6天前

一位用户演示了为本地LLM智能体添加MCP工具用于本地图像和视频生成,实现了按需全离线免费的生成。

0 人收藏 0 人点赞
#image-generation

@FinanceYF5: 3年的 AI 进步 ModelScope(左) Grok Imagine 1.5(右)

X AI KOLs Following · 2026-06-18 缓存

展示了三年来的AI进步:左侧为ModelScope,右侧为Grok Imagine 1.5。

0 人收藏 0 人点赞
#image-generation

Midjourney,这家图像生成公司,刚刚打造了MRI的继任者

Reddit r/singularity · 2026-06-18

Midjourney,以AI图像生成闻名,开发了一项被描述为MRI继任者的新技术,很可能提升医学影像能力。

0 人收藏 0 人点赞
#image-generation

FreeStyle:基于社区LoRA挖掘的风格-内容双参考生成的自由控制

Hugging Face Daily Papers · 2026-06-18 缓存

FreeStyle提出了一种可扩展的双参考生成框架,利用社区LoRA挖掘构建大规模风格-内容三元组,并采用解耦机制防止内容泄露,同时引入了一个全面的基准用于评估。

0 人收藏 0 人点赞
#image-generation

FID 彩票:量化生成模型评估中的隐藏随机性

Hugging Face Daily Papers · 2026-06-18 缓存

本文分析了不同训练种子和采样种子下FID分数的方差,揭示了图像生成评估中显著的可重复性问题。它提出了一种新的评估协议,包括误差带和每单元最优引导调整。

0 人收藏 0 人点赞
#image-generation

ostris/ideogram_4_turbotime_lora

Hugging Face Models Trending · 2026-06-17 缓存

一种LoRA,它适配Ideogram 4,可在仅2步且无需CFG的情况下生成高质量图像,采用新颖的连续涡轮训练方法。

0 人收藏 0 人点赞
#image-generation

Comfy-Org/Boogu-Image

Hugging Face Models Trending · 2026-06-17 缓存

Comfy-Org已为ComfyUI重新打包了Boogu-Image模型文件,包括base、edit和turbo变体,具有不同的量化格式,以及一个LoRA和文本编码器。

0 人收藏 0 人点赞
#image-generation

谷歌新图像模型

Reddit r/singularity · 2026-06-17

谷歌发布了一款新的图像生成模型。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈