prunaai/z-image-turbo

Replicate Explore 模型

摘要

阿里巴巴60亿参数的Z-Image-Turbo文生图模型,经PrunaAI进一步压缩,可在8步扩散下于1秒内生成1024×1024双语文字照片级图像。

prunaai / z-image-turbo
查看原文
查看缓存全文

缓存时间: 2026/04/21 20:16

# Z-Image Turbo | 极速文本生成图像 API 来源:https://replicate.com/prunaai/z-image-turbo 基于 Tongyi-MAI 的 Z-Image-Turbo 优化版,借助 PrunaAI 压缩引擎再次提速。 ## 价格如何? 按图像分辨率(高 × 宽)计费: - ≤ 0.5 MP(50 万像素):$0.0025 - ≤ 1 MP(100 万像素):$0.005 - ≤ 2 MP(200 万像素):$0.01 ## 这是什么? Z-Image-Turbo 是一个 60 亿参数的文本到图像模型,可在亚秒内生成照片级真实图像。PrunaAI 对其进一步加速,质量不变。 仅需 8 步即可出图,是目前最快之一。特别擅长: 1. 照片级真实感 2. 中英双语文字准确渲染 ## 为何这么快? 基座模型采用 Decoupled-DMD(分布匹配蒸馏)技术,将大模型压缩成小模型而不掉点。PrunaAI 再叠加缓存、编译、量化等优化,榨干每一毫秒性能。 简单说:本来已快,现在更快。 ## 何时用它? 适合以下场景: - **快速迭代**:秒级出图,原型设计、灵感探索神器 - **图中带字**:复杂文字渲染稳,中英文招牌、封面、标签都能清晰呈现 - **照片级真实**:人像、场景、自然光效表现优秀 - **低成本**:越快越省钱,大批量生成更划算 ## 特性 **照片级质量**:自然光、真实纹理、可信场景,人脸与物体细节到位。 **双语文字渲染**:招牌、书封、标签、海报里的中英文字都能精准呈现。 **极速生成**:8 步出图,秒级完成;企业级硬件亚秒级。 **单流架构**:Single-Stream Diffusion Transformer 统一处理文本与图像信息,效率更高。 ## 使用技巧 **提示词要具体**:别写“一个女人”,写“一位穿红色传统服饰、刺绣精细的年轻女子,柔光自然光,户外场景”。 **加风格关键词**:如“照片级”“电影感”“肖像摄影”,或指定“黄金时刻”“影棚光”。 **文字指令清晰**:想要图中文字就明说,如“咖啡店门面,招牌用优雅金色字体写着‘Morning Brew’”。 **最优设置**:分辨率 1024×1024,推理步数 9(实际 8 次前向),guidance scale 设为 0.0(turbo 模型专用)。 ## 技术背景 Z-Image-Turbo 源自阿里巴巴 AI 研究部门 Tongyi-MAI,基座用先进蒸馏技术训练,专为高速高质生成。 PrunaAI 优化引擎叠加缓存、编译、量化等压缩手段,在不影响质量的前提下再提速。 最终:更快,依旧照片级,依旧好写字。 ## 谁做的? 基座模型来自 Tongyi-MAI,优化版由 PrunaAI 出品。PrunaAI 专注让各类生成模型(文本、图像、视频、音频)更快更省。 模型开源,Apache 2.0 许可证,可商用。 ## 立即体验 在 Replicate 游乐场试用: [replicate.com/playground](https://replicate.com/playground) 模型创建时间:4 个月 3 周前 最近更新:1 个月 3 周前

相似文章

baidu/ERNIE-Image-Turbo

Hugging Face Models Trending

百度发布了ERNIE-Image-Turbo,一个蒸馏文本到图像生成模型,可在8步推理中实现快速生成,同时保持强大的文本渲染、指令遵循和结构化图像生成能力。

unsloth/ERNIE-Image-Turbo-GGUF

Hugging Face Models Trending

unsloth 发布了基于百度的 ERNIE-Image-Turbo 模型的 GGUF 量化版本,采用 Unsloth Dynamic 2.0 方法,能够在配备 24GB 显存的消费级 GPU 上通过 8 步推理高效实现文生图。

prunaai/p-image-edit

Replicate Explore

Pruna的p-image-edit是一款运行在Replicate平台上的高端AI模型,能够在一秒内快速完成业界领先的图像编辑,兼具速度、经济性和高视觉质量,精准遵循提示词并具备强大的文字渲染能力。

krea/Krea-2-Turbo

Hugging Face Models Trending

Krea发布了Krea 2 Turbo,一个120亿参数的文本到图像扩散模型,在Hugging Face上开放权重,并支持多个推理库。