image-generation

标签

Cards List
#image-generation

谷歌新图像模型

Reddit r/singularity · 2026-06-17

谷歌发布了一款新的图像生成模型。

0 人收藏 0 人点赞
#image-generation

ICML 2026 spotlight:通用美学对齐缩小艺术表达范围 [R]

Reddit r/MachineLearning · 2026-06-16

这篇ICML 2026 spotlight立场论文识别了图像生成对齐中的一个失败模式:美学偏好优化会覆盖用户的明确意图,将其称为'逆向对齐',并在反美学提示上进行了测试。

0 人收藏 0 人点赞
#image-generation

Comfy-Org/Krea-2

Hugging Face Models Trending · 2026-06-16 缓存

为 ComfyUI 重新打包的 Krea 2 模型文件和 LoRA,包含触发词和文件夹结构,便于集成。

0 人收藏 0 人点赞
#image-generation

@teropa: @sedielem 精彩地阐述了为什么扩散模型对图像如此有效。我们的视觉世界在空间上是…

X AI KOLs Following · 2026-06-16 缓存

解释为什么扩散模型对图像有效:低频频谱成分占主导,因此去噪先恢复粗略结构,再恢复细节——类似于频谱自回归。

0 人收藏 0 人点赞
#image-generation

@FinanceYF5: 现在居然能以超燃的日漫画风看世界杯了! AI,真有你的! (来自 Instagram 用户 leonrdewa)

X AI KOLs Timeline · 2026-06-16 缓存

展示了用AI将世界杯视频转化为超燃日漫画风的应用,来自Instagram用户leonrdewa。

0 人收藏 0 人点赞
#image-generation

Boogu/Boogu-Image-0.1-Edit

Hugging Face Models Trending · 2026-06-16 缓存

Boogu-Image-0.1 是一个基于 Apache-2.0 开源协议的统一图像生成与编辑模型家族,包含文本到图像、快速生成、编辑以及中英文文本渲染等变体,作为研究项目发布于 Hugging Face。

0 人收藏 0 人点赞
#image-generation

@vivimoneya: [AI日记]Mistral AI免费套餐,提供自家大模型 免费版包括 Mistral 的 SOTA AI models、最多 500 条记忆、图片生成、项目分组,以及 40+ 企业连接器。 领取免费套餐仅需验证手机号,无需绑定银行卡。 实…

X AI KOLs Timeline · 2026-06-16 缓存

Mistral AI 推出免费套餐,提供自家 SOTA 大模型、500 条记忆、图片生成、项目分组及 40+ 企业连接器,仅需验证手机号即可领取。

0 人收藏 0 人点赞
#image-generation

统一多模态自回归建模:共享上下文-视觉分词器是实现统一的关键

Hugging Face Daily Papers · 2026-06-16 缓存

UniAR提出了一个统一的自回归框架,使用单个离散视觉分词器桥接视觉理解与生成,在图像生成和编辑方面取得了最佳成果。

0 人收藏 0 人点赞
#image-generation

显露信号,隐藏噪声:像素空间扩散的频谱强制

Hugging Face Daily Papers · 2026-06-16 缓存

一种名为频谱强制(Spectral Forcing)的新技术,将时间条件化的二维离散余弦变换(2D-DCT)低通算子应用于像素空间扩散模型,通过显式分离信号与噪声提升效率,在ImageNet及文生图任务上超越基线方法。

0 人收藏 0 人点赞
#image-generation

@jiqizhixin:如果只需要一步就能生成高质量图像,而不是数百步?斯坦福和字节跳动推出 W-Flow……

X AI KOLs Timeline · 2026-06-15 缓存

斯坦福和字节跳动推出 W-Flow,一种单步生成模型,利用 Wasserstein 梯度流实现了最先进的单步 ImageNet 256x256 生成(FID 1.29),采样速度比多步扩散模型快 100 倍。

0 人收藏 0 人点赞
#image-generation

AgentBrush

Product Hunt · 2026-06-15

AgentBrush 是一个为编程代理添加图像生成能力的工具。

0 人收藏 0 人点赞
#image-generation

LLM Gateway Chat

Product Hunt · 2026-06-15

LLM Gateway Chat 是一个平台,提供对多种AI模型的访问,用于聊天、图像、视频和音频生成。

0 人收藏 0 人点赞
#image-generation

@elonmusk:试试最新的Grok Imagine!

X AI KOLs Timeline · 2026-06-14 缓存

埃隆·马斯克宣布最新的Grok Imagine,一款AI图像生成模型,演示快速生成剑斗场景。

0 人收藏 0 人点赞
#image-generation

InterleaveThinker: 增强智能体交错生成

Hugging Face Daily Papers · 2026-06-11 缓存

InterleaveThinker 引入了一种多智能体流水线,包含规划器和评论家智能体,使现有图像生成器具备交错文本-图像生成能力,其性能与最先进模型相当,并提升了推理基准测试成绩。

0 人收藏 0 人点赞
#image-generation

通过教师对齐的端到端蒸馏实现高保真两步图像生成

Hugging Face Daily Papers · 2026-06-10 缓存

本文介绍了Z-Image Turbo++,这是一个两步图像生成模型,通过使用分布对齐的对抗学习、步骤解耦参数化以及带有迭代正则化的端到端训练,从八步教师模型中蒸馏而来,旨在缩小与多步生成之间的质量差距。

0 人收藏 0 人点赞
#image-generation

如何构建一个能帮助管理创意工作流程的智能体,而不仅仅是提供想法?

Reddit r/openclaw · 2026-06-09

一位珠宝设计师寻求建议,希望构建一个AI智能体来自动化创意工作流程中的重复性环节,例如概念验证、提示词生成和文件整理,而不仅仅是生成想法。

0 人收藏 0 人点赞
#image-generation

RazzzHF/Realism_Engine_Ideogram_4

Hugging Face Models Trending · 2026-06-09 缓存

一个面向Ideogram 4的逼真引擎模型,托管在Hugging Face上,无跟踪下载或推理提供商支持。

0 人收藏 0 人点赞
#image-generation

Notra 图像生成

Product Hunt · 2026-06-09

Notra 是一个工具,可以将合并的拉取请求转化为符合品牌形象的市场营销视觉素材。

0 人收藏 0 人点赞
#image-generation

@xiaogaifun: https://x.com/xiaogaifun/status/2064268648601268540

X AI KOLs Timeline · 2026-06-09 缓存

详细总结了使用Codex工具的8个高频场景,包括配图、整理磁盘、转Slides、处理会议纪要、连接飞书和微信读书、部署网站以及处理公司日常事务,展示了AI助手在实际工作与生活中的多种应用。

0 人收藏 0 人点赞
#image-generation

IDEAL:深度对齐实现离散表示自编码器

Hugging Face Daily Papers · 2026-06-09 缓存

IDEAL提出了一种用于离散表示自编码的深度对齐框架,联合对齐量化令牌与浅层和深层VFM特征,以实现卓越的重建和生成性能。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈