image-generation

#image-generation

基于信息论的无分类器引导与自适应调度优化

arXiv cs.LG ↗ · 昨天缓存

提出了一种基于信息论的框架，用于优化扩散模型中的无分类器引导调度，在ImageNet和COCO基准上实现了条件一致性与样本多样性之间更优的权衡。

0 人收藏 0 人点赞

#image-generation

DiffusionBench：迈向生成式扩散变换器的全面评估

Hacker News Top ↗ · 昨天缓存

介绍了DiffusionBench，这是一个统一的基准，用于全面评估生成式扩散变换器，支持多种生成任务，并提供标准化的训练与评估。

0 人收藏 0 人点赞

#image-generation

Krea 2 技术报告 (59分钟阅读)

TLDR AI ↗ · 昨天缓存

Krea 2 是一系列用于创意图像生成的基础模型，构建于大规模数据基础设施和多阶段训练流程之上。它引入了提示扩展器和风格参考系统，以提高可操控性并实现创意探索。

0 人收藏 0 人点赞

#image-generation

Krea 2 在 Hugging Face 上发布

Reddit r/LocalLLaMA ↗ · 昨天缓存

Krea 2 是一个拥有120亿参数的文本到图像扩散模型，以开放权重形式在 Hugging Face 上发布，提供了 Raw（基础版）和 Turbo（后训练版）检查点。

0 人收藏 0 人点赞

#image-generation

内容写作、逼真图像生成和氛围编码的最佳低价模型是什么？

Reddit r/AI_Agents ↗ · 昨天

询问关于用于内容写作、图像生成和氛围编码的平价AI模型的推荐。

0 人收藏 0 人点赞

#image-generation

Boogu Base、Turbo、Edit —— 开源统一图像生成与编辑模型系列

Reddit r/LocalLLaMA ↗ · 2天前

Boogu 发布了一系列开源统一图像生成与编辑模型，包括 Base、Turbo 和 Edit 变体。

0 人收藏 0 人点赞

#image-generation

DiffusionBench：扩散变换器的全面评估

Hugging Face Daily Papers ↗ · 2天前缓存

研究人员引入了NanoGen，一个用于训练和评估扩散变换器的统一框架，并提出了DiffusionBench，一个结合了ImageNet类别条件和文本到图像生成的全面基准，以更好地评估生成建模的进展。

0 人收藏 0 人点赞

#image-generation

Semantic Browsing: 图像生成中的可控多样性

Hugging Face Daily Papers ↗ · 3天前缓存

Semantic Browsing 引入了一种方法，通过使用一个 Vision Language Model 和代理工作流，在文本到图像生成中实现基于语义决策的结构化、可解释的可控多样性。

0 人收藏 0 人点赞

#image-generation

本地文本到图像模型对比：终极测试。

Reddit r/LocalLLaMA ↗ · 3天前

用户使用192个提示词对本地文本到图像模型进行了全面对比，评估了文本渲染、人脸、人体解剖、空间构图等能力，结果和提示词已在imagebench.ai上公开。

0 人收藏 0 人点赞

#image-generation

我从头开始预训练和后训练了一个500M参数的LLM和一个330M参数的图像生成器

Reddit r/LocalLLaMA ↗ · 3天前

作者详细介绍了从头开始预训练和后训练一个500M参数的语言模型和一个330M参数的图像生成器的过程。

0 人收藏 0 人点赞

#image-generation

Thumbmagic

Product Hunt ↗ · 4天前

Thumbmagic 是一个AI缩略图生成器，基于表现最佳的缩略图训练。

0 人收藏 0 人点赞

#image-generation

@cellinlab: 卧槽！秒啊！我怎么就没想到这个用法用内嵌浏览器做 Codex Image 2 的生图无限画布！

X AI KOLs Timeline ↗ · 5天前缓存

发现一个创意用法：利用内嵌浏览器实现Codex Image 2的无限画布生图。

0 人收藏 0 人点赞

#image-generation

给我本地LLM智能体添加了MCP工具用于本地图像+视频生成，因此它在我要求时就能生成（完全离线+免费）

Reddit r/LocalLLaMA ↗ · 6天前

一位用户演示了为本地LLM智能体添加MCP工具用于本地图像和视频生成，实现了按需全离线免费的生成。

0 人收藏 0 人点赞

#image-generation

@FinanceYF5: 3年的 AI 进步 ModelScope（左） Grok Imagine 1.5（右）

X AI KOLs Following ↗ · 2026-06-18 缓存

展示了三年来的AI进步：左侧为ModelScope，右侧为Grok Imagine 1.5。

0 人收藏 0 人点赞

#image-generation

Midjourney，这家图像生成公司，刚刚打造了MRI的继任者

Reddit r/singularity ↗ · 2026-06-18

Midjourney，以AI图像生成闻名，开发了一项被描述为MRI继任者的新技术，很可能提升医学影像能力。

0 人收藏 0 人点赞

#image-generation

FreeStyle：基于社区LoRA挖掘的风格-内容双参考生成的自由控制

Hugging Face Daily Papers ↗ · 2026-06-18 缓存

FreeStyle提出了一种可扩展的双参考生成框架，利用社区LoRA挖掘构建大规模风格-内容三元组，并采用解耦机制防止内容泄露，同时引入了一个全面的基准用于评估。

0 人收藏 0 人点赞

#image-generation

FID 彩票：量化生成模型评估中的隐藏随机性

Hugging Face Daily Papers ↗ · 2026-06-18 缓存

本文分析了不同训练种子和采样种子下FID分数的方差，揭示了图像生成评估中显著的可重复性问题。它提出了一种新的评估协议，包括误差带和每单元最优引导调整。

0 人收藏 0 人点赞

#image-generation

ostris/ideogram_4_turbotime_lora

Hugging Face Models Trending ↗ · 2026-06-17 缓存

一种LoRA，它适配Ideogram 4，可在仅2步且无需CFG的情况下生成高质量图像，采用新颖的连续涡轮训练方法。

0 人收藏 0 人点赞

#image-generation

Comfy-Org/Boogu-Image

Hugging Face Models Trending ↗ · 2026-06-17 缓存

Comfy-Org已为ComfyUI重新打包了Boogu-Image模型文件，包括base、edit和turbo变体，具有不同的量化格式，以及一个LoRA和文本编码器。

0 人收藏 0 人点赞

#image-generation

谷歌新图像模型

Reddit r/singularity ↗ · 2026-06-17

谷歌发布了一款新的图像生成模型。

0 人收藏 0 人点赞

image-generation

提交意见反馈