SeeSee21/Z-Anime

Hugging Face Models Trending 模型

摘要

Z-Anime 是对阿里巴巴 Z-Image Base 模型进行全面微调的产物,专门用于高质量动漫生成,支持自然语言提示词,且显存占用较低。

任务:文生图 标签:diffusers, safetensors, gguf, z-anime, text-to-image, image-generation, diffusion, anime, z-image, comfyui, fp8, bf16, aio, en, base_model:Tongyi-MAI/Z-Image, base_model:finetune:Tongyi-MAI/Z-Image, license:apache-2.0, region:us
查看原文
查看缓存全文

缓存时间: 2026/05/08 08:53

SeeSee21/Z-Anime · Hugging Face

来源:https://huggingface.co/SeeSee21/Z-Anime

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%8E%8C-z-anime–full-anime-fine-tune-on-z-image-base🎌 Z-Anime | 基于 Z-Image Base 的完整动漫风格微调

Z-Anime

完整微调 • 丰富美学 • 强多样性 • 全面支持负面提示词 BF16 & FP8 & GGUF & AIO • 自然语言提示 • 8GB 显存


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%96%BC%EF%B8%8F-preview-gallery🖼️ 预览画廊


https://huggingface.co/SeeSee21/Z-Anime#%E2%9C%A8-what-is-z-anime✨ 什么是 Z-Anime?

Z-Anime 是对阿里巴巴 Z-Image Base 架构的完整微调——并非 LoRA 合并,而是从零开始构建的专注于动漫风格的模型家族。

Z-Anime 构建于 S3-DiT(单流扩散变压器,60 亿参数) 之上,继承了 Z-Image Base 的坚实基础:丰富的多样性、强大的可控性、完整的负面提示词支持以及极高的微调上限——现已适配动漫风格生成。

本仓库包含完整的 Z-Anime 家族

变体重点最佳用途
🎌 Z-Anime Base最高质量最终渲染,完全控制
Z-Anime Distill-8-Step速度与质量平衡日常生成
🚀 Z-Anime Distill-4-Step最大速度快速迭代,批量处理
📦 GGUF 变体降低内存占用低显存 / CPU / AMD 友好工作流
📦 AIO 变体单文件便利性简易 ComfyUI 设置
🐍 Diffusers 文件夹from_pretrained() 就绪Python 管道,进一步微调

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%8E%AF-key-features🎯 主要特性

  • ✅ 基于 Z-Image Base 的完整微调——并非 LoRA 合并
  • ✅ 丰富的动漫美学与强烈的风格多样性
  • ✅ 自然语言提示——描述性提示词效果最佳,而非标签列表
  • ✅ 在角色、姿态、构图和布局方面具有高多样性
  • ✅ 支持 LoRA 训练——为进一步微调提供强大基础
  • ✅ 部分支持 NSFW 内容
  • ✅ 兼容 8GB 显存
  • ✅ 提供 GGUF 变体
  • ✅ 提供 AIO 变体(Base, 4-Step, 8-Step)

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%97%BA%EF%B8%8F-z-anime-roadmap🗺️ Z-Anime 路线图

https://huggingface.co/SeeSee21/Z-Anime#%E2%9C%85-released✅ 已发布

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%8E%8C-z-anime-base🎌 Z-Anime Base

基于 Z-Image Base 的完整微调——BF16 & FP8

https://huggingface.co/SeeSee21/Z-Anime#%E2%9A%A1-z-anime-distill-8-step⚡ Z-Anime Distill-8-Step

BF16 & FP8——仅需 8 步 即可快速生成动漫图像,CFG 1.0

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%9A%80-z-anime-distill-4-step🚀 Z-Anime Distill-4-Step

BF16 & FP8——仅需 4 步 即可极速生成动漫图像,CFG 1.0

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%93%A6-gguf-variants📦 GGUF 变体

适用于低显存CPU 推理AMD 友好的工作流。

  • Z-Anime-Base-Q8_0—— Q8_0 量化(~6.73 GB
  • Z-Anime-Base-Q4_K_S—— Q4_K_S 量化(~4.2 GB

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%93%A6-aio-variants📦 AIO 变体

单文件检查点,将图像模型 + VAE + 文本编码器集成在一个文件中。提供 BaseDistill-4-StepDistill-8-Step 版本,每种均有 BF16 & FP8 格式。

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%A7%A9-vae–text-encoder🧩 VAE 和文本编码器

所需的 VAE (ae.safetensors) 和 文本编码器 (qwen_3_4b.safetensors) 也包含在此仓库中,供使用标准(非 AIO)变体的用户运行。

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%90%8D-diffusers-folder🐍 Diffusers 文件夹

包含完整的 Diffusers 格式文件夹 (diffusers/)——与 ZImagePipeline.from_pretrained() 即插即用兼容,适合希望在 ComfyUI 之外运行推理或将 Z-Anime 作为进一步微调起点的 Python 用户。

更多更新即将到来——请关注以获取通知!🎌


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%93%A6-versions-overview📦 版本概览

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%9F%A2-bf16-12gb🟢 BF16 (~12GB)

最高精度。BFloat16 格式,质量妥协最小。最适合最终渲染、精细工作和 LoRA 训练。

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%9F%A1-fp8-6gb🟡 FP8 (~6GB)

推荐给大多数用户。文件更小,下载更快,与 BF16 相比仅有轻微权衡,质量极佳。

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%94%B5-gguf🔵 GGUF

专为轻量级推理设置优化,特别适用于低显存、CPU 推理或替代后端。

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%9F%A3-aio🟣 AIO

单文件检查点,将图像模型 + 文本编码器 + VAE 集成到一个文件中,设置最简单。提供 Base、Distill-4-Step 和 Distill-8-Step 版本。


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%8E%8C-z-anime-base-1🎌 Z-Anime Base

Z-Anime 家族的基础。

具有最高质量上限最广泛创作范围完整负面提示词支持的完整微调模型。

https://huggingface.co/SeeSee21/Z-Anime#recommended-settings推荐设置

steps: 28-50 cfg: 3.0-5.0 # 最高可达 9.0 sampler: euler_ancestral scheduler: beta negative_prompt: 强烈建议使用

https://huggingface.co/SeeSee21/Z-Anime#cfg-guideCFG 指南

  • 3.0–5.0→ 质量与创造力平衡的最佳区间
  • 5.0–7.0→ 更紧密地遵循提示词
  • 7.0–9.0→ 最大控制力,但需注意过饱和
  • 高于 9.0→ 不推荐

负面提示词对 Z-Anime Base 具有完全效果,并强烈建议使用。


https://huggingface.co/SeeSee21/Z-Anime#%E2%9A%A1-z-anime-distill-8-step-1⚡ Z-Anime Distill-8-Step

家族中的平衡之选。

从 Z-Anime Base 蒸馏而来,此版本仅需 8 步 即可提供强大的动漫结果,同时保留大部分质量。

https://huggingface.co/SeeSee21/Z-Anime#recommended-settings-1推荐设置

steps: 8 cfg: 1.0 # 最大约 1.5 sampler: euler_ancestral scheduler: beta negative_prompt: 效果有限

https://huggingface.co/SeeSee21/Z-Anime#cfg-guide-1CFG 指南

  • CFG 1.0 效果最佳
  • 小幅增加至 1.3–1.5 是可行的
  • 不要超过 1.5——可能会出现伪影

在此蒸馏层级下,负面提示词仅有有限效果。如果您的工作流包含 ConditioningZeroOut,请优先使用它而不是大型负面提示词。


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%9A%80-z-anime-distill-4-step-1🚀 Z-Anime Distill-4-Step

最快的 Z-Anime 变体。

专为最大吞吐量设计——适合快速原型制作、快速批量生成和以速度为重点的工作流。

https://huggingface.co/SeeSee21/Z-Anime#recommended-settings-2推荐设置

steps: 4 cfg: 1.0 # 最大约 1.5 sampler: euler_ancestral scheduler: beta negative_prompt: 效果有限

https://huggingface.co/SeeSee21/Z-Anime#tips-for-4-step4-Step 技巧

  • 保持在 CFG 1.0 以获得最稳定的结果
  • 将最重要的视觉细节放在提示词的前面
  • 可选的超分工具(如 hires fix 或 SeedVR2)有助于恢复精细细节

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%93%90-resolution-guide📐 分辨率指南

用例分辨率
肖像 / 角色艺术832 × 1216
风景 / 场景 / 背景1216 × 832
正方形 / 通用1024 × 1024
高 / 全身 / 壁纸768 × 1344
电影感 / 宽景1920 × 1088
详细肖像1024 × 1536

支持范围: 大约 512 × 512 到 2048 × 2048,任意纵横比。所有主要变体均设计用于在 8GB 显存 上运行。


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%92%A1-prompting-guide💡 提示词指南

自然语言效果最佳——而非标签列表。

https://huggingface.co/SeeSee21/Z-Anime#%E2%9C%85-good✅ 良好示例

A young anime girl with long silver hair and golden eyes, wearing a traditional shrine maiden outfit with white haori and red hakama. She stands in a sunlit bamboo forest, cherry blossoms falling softly around her. Warm afternoon light filtering through the trees, detailed fabric shading, expressive face, calm serene expression, high quality anime illustration with fine line work.

https://huggingface.co/SeeSee21/Z-Anime#%E2%9D%8C-avoid❌ 避免示例

anime girl, silver hair, shrine maiden, bamboo, cherry blossom, warm light

https://huggingface.co/SeeSee21/Z-Anime#character-portraits角色肖像

Detailed anime portrait of [character], soft rim lighting, expressive eyes with detailed reflections, fine hair strands, clean linework, professional anime illustration quality.

https://huggingface.co/SeeSee21/Z-Anime#action-scenes动作场景

Dynamic anime [scene], dramatic angle, motion energy, speed lines, particle effects, cinematic composition, detailed shading, high quality anime art.

https://huggingface.co/SeeSee21/Z-Anime#backgrounds–landscapes背景与风景

Anime [location] at [time of day], [lighting], [atmosphere], beautiful background art, wallpaper quality, highly detailed environment.


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%94%A7-installation🔧 安装

https://huggingface.co/SeeSee21/Z-Anime#step-1–download-the-version-you-want步骤 1 — 下载您想要的版本

选择以下之一:

  • 标准 / 蒸馏模型,提供 BF16FP8 格式(+ VAE + 文本编码器)
  • GGUF 变体,适用于低显存 / CPU / AMD 友好推理(+ VAE + 文本编码器)
  • AIO 变体,提供单文件便利性(无需额外的 VAE / 文本编码器)

https://huggingface.co/SeeSee21/Z-Anime#step-2–place-the-files步骤 2 — 放置文件

https://huggingface.co/SeeSee21/Z-Anime#standard-bf16–fp8-models标准 BF16 / FP8 模型

ComfyUI/models/diffusion_models/ ├── z-anime-base-bf16.safetensors ├── z-anime-base-fp8.safetensors ├── z-anime-distill-8step-bf16.safetensors ├── z-anime-distill-8step-fp8.safetensors ├── z-anime-distill-4step-bf16.safetensors └── z-anime-distill-4step-fp8.safetensors

https://huggingface.co/SeeSee21/Z-Anime#gguf-variantsGGUF 变体

ComfyUI/models/unet/ ├── z-anime-base-q8_0.gguf └── z-anime-base-q4_k_s.gguf

https://huggingface.co/SeeSee21/Z-Anime#text-encoder文本编码器

包含两个文本编码器——任选一个

ComfyUI/models/clip/ └── qwen_3_4b-bf16.safetensors # 默认(Z-Image 标准,BF16) 或 └── qwen_3_4b-fp8.safetensors # 默认(Z-Image 标准,FP8) 或 └── qwen_3_4b-engineer-v4-bf16.safetensors # 替代(Engineer V4,BF16) 或 └── qwen_3_4b-engineer-v4-fp8.safetensors # 替代(Engineer V4,FP8)

  • 默认 (qwen_3_4b-*)—— 标准的 Z-Image 文本编码器,打包为单个 .safetensors 文件(BF16 + FP8)。这是模型训练时所使用的。
  • Engineer V4 (qwen_3_4b-engineer-v4-*)—— 由 BennyDaBall 提供的 Z-Image 文本编码器的替代完整微调版本,即插即用。通常能从相同的种子产生更多样化的输出。请参阅下方的致谢以获取原始仓库。

https://huggingface.co/SeeSee21/Z-Anime#vaeVAE

ComfyUI/models/vae/ └── ae.safetensors

https://huggingface.co/SeeSee21/Z-Anime#aio-variantsAIO 变体

对于 AIO 版本,您只需要单个检查点文件——无需额外的 VAE 或文本编码器:

ComfyUI/models/checkpoints/ ├── z-anime-base-aio-bf16.safetensors ├── z-anime-base-aio-fp8.safetensors ├── z-anime-distill-8step-aio-bf16.safetensors ├── z-anime-distill-8step-aio-fp8.safetensors ├── z-anime-distill-4step-aio-bf16.safetensors └── z-anime-distill-4step-aio-fp8.safetensors

https://huggingface.co/SeeSee21/Z-Anime#step-3–load-in-comfyui步骤 3 — 在 ComfyUI 中加载

https://huggingface.co/SeeSee21/Z-Anime#for-standard-bf16–fp8-versions对于标准 BF16 / FP8 版本

使用:

  • Load Diffusion Model 加载模型文件
  • CLIP Loader 加载文本编码器
  • VAE Loader 加载 VAE

https://huggingface.co/SeeSee21/Z-Anime#for-gguf-versions对于 GGUF 版本

  • models/unet/ 文件夹加载 GGUF 模型
  • 使用上述相同的 CLIPVAE 文件

https://huggingface.co/SeeSee21/Z-Anime#for-aio-versions对于 AIO 版本

使用标准的 Checkpoint Loader——无需额外加载 CLIP 或 VAE。


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%93%A6-custom-nodes📦 自定义节点

  • rgthree-comfy
  • ComfyUI-Lora-Manager
  • ComfyUI-GGUF*(仅用于 GGUF 变体)*
  • ComfyUI-SeedVR2_VideoUpscaler*(可选,仅用于 SeedVR2 超分)*

https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%90%8D-using-the-diffusers-folder🐍 使用 Diffusers 文件夹

对于 Python 用户,完整的 Diffusers 格式文件夹包含在 diffusers/ 下,可以使用 subfolder 参数直接加载:

`` import torch from diffusers import ZImagePipeline

pipe = ZImagePipeline.from_pretrained( “SeeSee21/Z-Anime”, subfolder=“diffusers”, torch_dtype=torch.bfloat16, ).to(“cuda”)

image = pipe( prompt=“A young anime girl with long silver hair and golden eyes, “ “shrine maiden outfit, sunlit bamboo forest, cherry blossoms, “ “professional anime illustration, fine line work.”, num_inference_steps=40, guidance_scale=4.0, ).images[0]

image.save(“z-anime-output.png”) ``

此格式也是使用 OneTrainerdiffuserskohya-ss 等框架进行进一步微调(LoRA 或完整微调)的良好起点。


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%A7%A9-official-workflow🧩 官方工作流

Z-Anime Workflow

workflows/Z-Anime-Workflow-v1.json (https://huggingface.co/SeeSee21/Z-Anime/blob/main/workflows/Z-Anime-Workflow-v1.json) 中包含了一个支持所有变体(Base / Distill-8 / Distill-4, BF16 / FP8 / GGUF / AIO)的即用型 ComfyUI 工作流。

它包括:

  • 📦 模型切换(Diffusion / GGUF / AIO 加载器——一次切换一个)
  • 📖 可选 LoRA 加载器
  • ✍️ 正面 + 负面提示词节点(带有默认动漫负面提示词)
  • 📐 分辨率预设
  • 🎨 生成 + 🔼 可选 1.5× 超分并附带并排比较
  • 📚 内置 MarkdownNote 指南,包含每种变体的设置

Z-Anime Workflow 概览


https://huggingface.co/SeeSee21/Z-Anime#%F0%9F%93%81-repository-structure📁 仓库结构

Z-Anime/ ├── README.md ├── config.json │ ├── diffusion_models/ │ ├── z-anime-base-bf16.safetensors │ ├── z-anime-base-fp8.safetensors │ ├── z-anime-distill-8step-bf16.safetensors │ ├── z-anime-distill-8step-fp8.safetensors │ ├── z-anime-distill-4step-bf16.safetensors │ └── z-anime-distill-4step-fp8.safetensors │ ├── gguf/ │ ├── z-anime-base-q8_0.gguf │ └── z-anime-base-q4_k_s.gguf │ ├── aio/ │ ├── z-anime-base-aio-bf16.safetensors │ ├── z-anime-base-aio-fp8.safetensors │ ├── z-anime-distill-8step-aio-bf16.safetensors │ ├── z-anime-distill-8step-aio-fp8.safetensors │ ├── z-anime-distill-4step-aio-bf16.safetensors │ └── z-anime-distill-4step-aio-fp8.safetensors │ ├── text_encoder/ │ ├── qwen_3_4b-bf16.safetensors # 默认 │ ├── qwen_3_4b-fp8.safetensors # 默认 │ ├── qwen_3_4b-engineer-v4-bf16.safetensors # 替代(BennyDaBall) │ └── qwen_3_4b-engineer-v4-fp8.safetensors # 替代(BennyDaBall) │ ├── vae/ │ └── ae.safetensors │ ├── diffusers/ │ ├── model_index.json │ ├── scheduler/ │ ├── tokenizer/ │ ├── text_encoder/ │ ├── transformer/ (分块 safetensors + 索引) │ └── vae/ │ ├── images/ │ ├── cover.png │ ├── workflow-cover.png │ ├── workflow-overview.png

相似文章

aisha-ai-official/animagine-xl-v4-opt

Replicate Explore

这是 Animagine XL v4 Opt 模型的页面,它是 Stable Diffusion XL 的一个开源微调模型,针对动漫风格图像生成进行了优化,可通过 Replicate 使用。

prunaai/z-image-turbo

Replicate Explore

阿里巴巴60亿参数的Z-Image-Turbo文生图模型,经PrunaAI进一步压缩,可在8步扩散下于1秒内生成1024×1024双语文字照片级图像。

circlestone-labs/Anima

Hugging Face Models Trending

Anima 是一个拥有20亿参数的文生图模型,专注于动漫和插画风格,由 CircleStone Labs 与 Comfy Org 合作开发,以开源形式发布在 Hugging Face 上。

最强本地AI图像生成器来了!

YouTube AI Channels

Ernie Image,全新开源扩散模型,文字渲染与提示词忠实度全面超越Zage,可在ComfyUI本地运行,仅需约20 GB显存。

ZAYA1-74B-Preview:在AMD上扩展预训练

Reddit r/LocalLLaMA

Zyphra发布ZAYA1-74B-Preview,一个在AMD硬件上训练的740亿参数基础模型,强调了强大的预强化学习推理能力和智能体性能信号。