prunaai/z-image-turbo
摘要
阿里巴巴60亿参数的Z-Image-Turbo文生图模型,经PrunaAI进一步压缩,可在8步扩散下于1秒内生成1024×1024双语文字照片级图像。
prunaai / z-image-turbo
查看缓存全文
缓存时间: 2026/04/21 20:16
# Z-Image Turbo | 极速文本生成图像 API
来源:https://replicate.com/prunaai/z-image-turbo
基于 Tongyi-MAI 的 Z-Image-Turbo 优化版,借助 PrunaAI 压缩引擎再次提速。
## 价格如何?
按图像分辨率(高 × 宽)计费:
- ≤ 0.5 MP(50 万像素):$0.0025
- ≤ 1 MP(100 万像素):$0.005
- ≤ 2 MP(200 万像素):$0.01
## 这是什么?
Z-Image-Turbo 是一个 60 亿参数的文本到图像模型,可在亚秒内生成照片级真实图像。PrunaAI 对其进一步加速,质量不变。
仅需 8 步即可出图,是目前最快之一。特别擅长:
1. 照片级真实感
2. 中英双语文字准确渲染
## 为何这么快?
基座模型采用 Decoupled-DMD(分布匹配蒸馏)技术,将大模型压缩成小模型而不掉点。PrunaAI 再叠加缓存、编译、量化等优化,榨干每一毫秒性能。
简单说:本来已快,现在更快。
## 何时用它?
适合以下场景:
- **快速迭代**:秒级出图,原型设计、灵感探索神器
- **图中带字**:复杂文字渲染稳,中英文招牌、封面、标签都能清晰呈现
- **照片级真实**:人像、场景、自然光效表现优秀
- **低成本**:越快越省钱,大批量生成更划算
## 特性
**照片级质量**:自然光、真实纹理、可信场景,人脸与物体细节到位。
**双语文字渲染**:招牌、书封、标签、海报里的中英文字都能精准呈现。
**极速生成**:8 步出图,秒级完成;企业级硬件亚秒级。
**单流架构**:Single-Stream Diffusion Transformer 统一处理文本与图像信息,效率更高。
## 使用技巧
**提示词要具体**:别写“一个女人”,写“一位穿红色传统服饰、刺绣精细的年轻女子,柔光自然光,户外场景”。
**加风格关键词**:如“照片级”“电影感”“肖像摄影”,或指定“黄金时刻”“影棚光”。
**文字指令清晰**:想要图中文字就明说,如“咖啡店门面,招牌用优雅金色字体写着‘Morning Brew’”。
**最优设置**:分辨率 1024×1024,推理步数 9(实际 8 次前向),guidance scale 设为 0.0(turbo 模型专用)。
## 技术背景
Z-Image-Turbo 源自阿里巴巴 AI 研究部门 Tongyi-MAI,基座用先进蒸馏技术训练,专为高速高质生成。
PrunaAI 优化引擎叠加缓存、编译、量化等压缩手段,在不影响质量的前提下再提速。
最终:更快,依旧照片级,依旧好写字。
## 谁做的?
基座模型来自 Tongyi-MAI,优化版由 PrunaAI 出品。PrunaAI 专注让各类生成模型(文本、图像、视频、音频)更快更省。
模型开源,Apache 2.0 许可证,可商用。
## 立即体验
在 Replicate 游乐场试用:
[replicate.com/playground](https://replicate.com/playground)
模型创建时间:4 个月 3 周前
最近更新:1 个月 3 周前
相似文章
baidu/ERNIE-Image-Turbo
百度发布了ERNIE-Image-Turbo,一个蒸馏文本到图像生成模型,可在8步推理中实现快速生成,同时保持强大的文本渲染、指令遵循和结构化图像生成能力。
unsloth/ERNIE-Image-Turbo-GGUF
unsloth 发布了基于百度的 ERNIE-Image-Turbo 模型的 GGUF 量化版本,采用 Unsloth Dynamic 2.0 方法,能够在配备 24GB 显存的消费级 GPU 上通过 8 步推理高效实现文生图。
prunaai/p-image-edit
Pruna的p-image-edit是一款运行在Replicate平台上的高端AI模型,能够在一秒内快速完成业界领先的图像编辑,兼具速度、经济性和高视觉质量,精准遵循提示词并具备强大的文字渲染能力。
krea/Krea-2-Turbo
Krea发布了Krea 2 Turbo,一个120亿参数的文本到图像扩散模型,在Hugging Face上开放权重,并支持多个推理库。
PrismML 刚刚发布了二值和三值的 Bonsai Image 4B:一种 1比特/三值文本到图像扩散变换器,甚至可以在浏览器中通过 WebGPU 100% 本地运行。
PrismML 发布了 Bonsai Image 4B 模型的二值和三值量化版本,使得文本到图像生成可以仅用 3GB 大小通过 WebGPU 在浏览器中本地运行,采用 Apache-2.0 许可证。