image-generation

#image-generation

谷歌新图像模型

Reddit r/singularity ↗ · 2026-06-17

谷歌发布了一款新的图像生成模型。

0 人收藏 0 人点赞

#image-generation

ICML 2026 spotlight：通用美学对齐缩小艺术表达范围 [R]

Reddit r/MachineLearning ↗ · 2026-06-16

这篇ICML 2026 spotlight立场论文识别了图像生成对齐中的一个失败模式：美学偏好优化会覆盖用户的明确意图，将其称为'逆向对齐'，并在反美学提示上进行了测试。

0 人收藏 0 人点赞

#image-generation

Comfy-Org/Krea-2

Hugging Face Models Trending ↗ · 2026-06-16 缓存

为 ComfyUI 重新打包的 Krea 2 模型文件和 LoRA，包含触发词和文件夹结构，便于集成。

0 人收藏 0 人点赞

#image-generation

@teropa: @sedielem 精彩地阐述了为什么扩散模型对图像如此有效。我们的视觉世界在空间上是…

X AI KOLs Following ↗ · 2026-06-16 缓存

解释为什么扩散模型对图像有效：低频频谱成分占主导，因此去噪先恢复粗略结构，再恢复细节——类似于频谱自回归。

0 人收藏 0 人点赞

#image-generation

@FinanceYF5: 现在居然能以超燃的日漫画风看世界杯了！ AI，真有你的！（来自 Instagram 用户 leonrdewa）

X AI KOLs Timeline ↗ · 2026-06-16 缓存

展示了用AI将世界杯视频转化为超燃日漫画风的应用，来自Instagram用户leonrdewa。

0 人收藏 0 人点赞

#image-generation

Boogu/Boogu-Image-0.1-Edit

Hugging Face Models Trending ↗ · 2026-06-16 缓存

Boogu-Image-0.1 是一个基于 Apache-2.0 开源协议的统一图像生成与编辑模型家族，包含文本到图像、快速生成、编辑以及中英文文本渲染等变体，作为研究项目发布于 Hugging Face。

0 人收藏 0 人点赞

#image-generation

@vivimoneya: [AI日记]Mistral AI免费套餐，提供自家大模型免费版包括 Mistral 的 SOTA AI models、最多 500 条记忆、图片生成、项目分组，以及 40+ 企业连接器。领取免费套餐仅需验证手机号，无需绑定银行卡。实…

X AI KOLs Timeline ↗ · 2026-06-16 缓存

Mistral AI 推出免费套餐，提供自家 SOTA 大模型、500 条记忆、图片生成、项目分组及 40+ 企业连接器，仅需验证手机号即可领取。

0 人收藏 0 人点赞

#image-generation

统一多模态自回归建模：共享上下文-视觉分词器是实现统一的关键

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

UniAR提出了一个统一的自回归框架，使用单个离散视觉分词器桥接视觉理解与生成，在图像生成和编辑方面取得了最佳成果。

0 人收藏 0 人点赞

#image-generation

显露信号，隐藏噪声：像素空间扩散的频谱强制

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

一种名为频谱强制（Spectral Forcing）的新技术，将时间条件化的二维离散余弦变换（2D-DCT）低通算子应用于像素空间扩散模型，通过显式分离信号与噪声提升效率，在ImageNet及文生图任务上超越基线方法。

0 人收藏 0 人点赞

#image-generation

@jiqizhixin：如果只需要一步就能生成高质量图像，而不是数百步？斯坦福和字节跳动推出 W-Flow……

X AI KOLs Timeline ↗ · 2026-06-15 缓存

斯坦福和字节跳动推出 W-Flow，一种单步生成模型，利用 Wasserstein 梯度流实现了最先进的单步 ImageNet 256x256 生成（FID 1.29），采样速度比多步扩散模型快 100 倍。

0 人收藏 0 人点赞

#image-generation

AgentBrush

Product Hunt ↗ · 2026-06-15

AgentBrush 是一个为编程代理添加图像生成能力的工具。

0 人收藏 0 人点赞

#image-generation

LLM Gateway Chat

Product Hunt ↗ · 2026-06-15

LLM Gateway Chat 是一个平台，提供对多种AI模型的访问，用于聊天、图像、视频和音频生成。

0 人收藏 0 人点赞

#image-generation

@elonmusk：试试最新的Grok Imagine！

X AI KOLs Timeline ↗ · 2026-06-14 缓存

埃隆·马斯克宣布最新的Grok Imagine，一款AI图像生成模型，演示快速生成剑斗场景。

0 人收藏 0 人点赞

#image-generation

InterleaveThinker: 增强智能体交错生成

Hugging Face Daily Papers ↗ · 2026-06-11 缓存

InterleaveThinker 引入了一种多智能体流水线，包含规划器和评论家智能体，使现有图像生成器具备交错文本-图像生成能力，其性能与最先进模型相当，并提升了推理基准测试成绩。

0 人收藏 0 人点赞

#image-generation

通过教师对齐的端到端蒸馏实现高保真两步图像生成

Hugging Face Daily Papers ↗ · 2026-06-10 缓存

本文介绍了Z-Image Turbo++，这是一个两步图像生成模型，通过使用分布对齐的对抗学习、步骤解耦参数化以及带有迭代正则化的端到端训练，从八步教师模型中蒸馏而来，旨在缩小与多步生成之间的质量差距。

0 人收藏 0 人点赞

#image-generation

如何构建一个能帮助管理创意工作流程的智能体，而不仅仅是提供想法？

Reddit r/openclaw ↗ · 2026-06-09

一位珠宝设计师寻求建议，希望构建一个AI智能体来自动化创意工作流程中的重复性环节，例如概念验证、提示词生成和文件整理，而不仅仅是生成想法。

0 人收藏 0 人点赞

#image-generation

RazzzHF/Realism_Engine_Ideogram_4

Hugging Face Models Trending ↗ · 2026-06-09 缓存

一个面向Ideogram 4的逼真引擎模型，托管在Hugging Face上，无跟踪下载或推理提供商支持。

0 人收藏 0 人点赞

#image-generation

Notra 图像生成

Product Hunt ↗ · 2026-06-09

Notra 是一个工具，可以将合并的拉取请求转化为符合品牌形象的市场营销视觉素材。

0 人收藏 0 人点赞

#image-generation

@xiaogaifun: https://x.com/xiaogaifun/status/2064268648601268540

X AI KOLs Timeline ↗ · 2026-06-09 缓存

详细总结了使用Codex工具的8个高频场景，包括配图、整理磁盘、转Slides、处理会议纪要、连接飞书和微信读书、部署网站以及处理公司日常事务，展示了AI助手在实际工作与生活中的多种应用。

0 人收藏 0 人点赞

#image-generation

IDEAL：深度对齐实现离散表示自编码器

Hugging Face Daily Papers ↗ · 2026-06-09 缓存

IDEAL提出了一种用于离散表示自编码的深度对齐框架，联合对齐量化令牌与浅层和深层VFM特征，以实现卓越的重建和生成性能。

0 人收藏 0 人点赞

image-generation

提交意见反馈