circlestone-labs/Anima

Hugging Face Models Trending 模型

摘要

Anima 是一个拥有20亿参数的文生图模型,专注于动漫和插画风格,由 CircleStone Labs 与 Comfy Org 合作开发,以开源形式发布在 Hugging Face 上。

标签: diffusion-single-file, comfyui, 许可证:其他, 地区:美国
查看原文
查看缓存全文

缓存时间: 2026/05/15 06:17

circlestone-labs/Anima · Hugging Face

来源:https://huggingface.co/circlestone-labs/Anima

Anima是一个20亿参数的文生图模型,由CircleStone Labs与Comfy Org合作创建。它主要专注于动漫概念、角色和风格,但也能生成多种其他非写实内容。该模型专为制作插画和艺术图像而设计,在写实领域表现不佳。

模型在数百万张动漫图像和约80万张非动漫艺术图像上训练。未使用任何合成数据进行训练。动漫训练数据的知识截止日期为2025年9月。

NEW: 尝试Turbo LoRA (https://civitai.com/models/2560840/anima-turbo-lora),以获得更好的稳定性和更快的生成速度。

https://huggingface.co/circlestone-labs/Anima#versions 版本

  • Anima-Base - 预训练但未经精炼的基础模型。具有最大的灵活性、多样性和风格遵循能力。
  • Anima-Turbo - 即将推出。

https://huggingface.co/circlestone-labs/Anima#installing-and-running 安装与运行

工作流:该模型在ComfyUI中受到原生支持。上方图像包含一个工作流;你可以在ComfyUI中打开它,或通过拖放获取工作流。模型文件应放置在模型目录下对应的文件夹中:

  • anima-base-v1.0.safetensors 放入 ComfyUI/models/diffusion_models
  • qwen_3_06b_base.safetensors 放入 ComfyUI/models/text_encoders
  • qwen_image_vae.safetensors 放入 ComfyUI/models/vae(这是Qwen-Image VAE,你可能已经拥有它)

https://huggingface.co/circlestone-labs/Anima#generation-settings 生成设置

  • 适用于512²至1536²像素之间的分辨率。
  • 30-50步,CFG 4-5。
  • 多种采样器均可使用。我偏爱的一些:
    • er_sde:风格中性,色彩平坦,线条锐利。我将其用作合理的默认选项。
    • euler_a:线条更柔和、更细。有时可能偏向2.5D效果。CFG可以比其他采样器推得略高,而不会烧坏图像。
    • dpmpp_2m_sde_gpu:风格类似er_sde,但能产生更多变化,更具“创造性”。根据提示不同,有时会过于狂野。
  • 如果要追求更写实/绘画感的效果,beta57调度器(ComfyUI RES4LYF自定义节点包)有助于生成更好的纹理,因为它更注重低噪声时间步。

https://huggingface.co/circlestone-labs/Anima#prompting 提示

模型在Danbooru风格的标签、自然语言描述以及标签与描述的混合数据上训练。

  • 标签使用小写字母,空格代替下划线。分数标签是唯一使用下划线的标签。
  • 推荐正向前缀:“masterpiece, best quality, score_7, safe, ”
  • 推荐负向:“worst quality, low quality, score_1, score_2, score_3, artist name”
  • 当标签在Danbooru和Gelbooru之间不一致时,优先使用Gelbooru版本。
  • 提示加权有效,但需要的权重高于SDXL常用的数值。示例:“(chibi:2)”

https://huggingface.co/circlestone-labs/Anima#tag-order 标签顺序

[质量/元数据/年份/安全标签] [1girl/1boy/1other等] [角色] [系列] [画师] [通用标签]

在每个标签部分内,标签可按任意顺序排列。

https://huggingface.co/circlestone-labs/Anima#quality-tags 质量标签

基于人工评分:masterpiece, best quality, good quality, normal quality, low quality, worst quality

基于PonyV7美学模型:score_9, score_8, …, score_1

你可以使用人工评分质量标签、美学模型标签、两者兼用或两者都不使用。所有组合均可。

https://huggingface.co/circlestone-labs/Anima#time-period-tags 时间标签

具体年份:year 2025, year 2024, …

时间段:newest, recent, mid, early, old

https://huggingface.co/circlestone-labs/Anima#meta-tags 元标签

highres, absurdres, anime screenshot, jpeg artifacts, official art, 等

https://huggingface.co/circlestone-labs/Anima#safety-tags 安全标签

safe, sensitive, nsfw, explicit

https://huggingface.co/circlestone-labs/Anima#artist-tags 画师标签

在画师名称前加@。例如“@big chungus”。**你必须在画师名称前加上@。**如果不加,效果会非常弱。

https://huggingface.co/circlestone-labs/Anima#full-tag-example 完整标签示例

year 2025, newest, normal quality, score_5, highres, safe, 1girl, oomuro sakurako, yuru yuri, @nnn yryr, smile, brown hair, hat, solo, fur-trimmed gloves, open mouth, long hair, gift box, fang, skirt, red gloves, blunt bangs, gloves, one eye closed, shirt, brown eyes, santa costume, red hat, skin fang, twitter username, white background, holding bag, fur trim, simple background, brown skirt, bag, gift bag, looking at viewer, santa hat, ;d, red shirt, box, gift, fur-trimmed headwear, holding, red capelet, holding box, capelet

https://huggingface.co/circlestone-labs/Anima#tag-dropout 标签丢弃

模型在训练时使用了随机标签丢弃。你无需为图像包含每一个相关标签。

https://huggingface.co/circlestone-labs/Anima#dataset-tags 数据集标签

为了提升风格和内容多样性,模型额外在两个非动漫数据集上训练:LAION-POP(特别是ye-pop版本)和DeviantArt。两者都经过过滤,排除了照片。由于这些数据集在质量上与动漫数据集不同,来自它们的描述被标记了“数据集标签”。该标签出现在提示的最开头,后跟换行符。可选地,第二行可以包含图像的alt文本(ye-pop)或作品的标题(DeviantArt)。示例:

ye-pop For Sale: Others by Arun Prem Abstract, oil painting of three faceless, blue-skinned figures. Left: white, draped figure; center: yellow-shirted, dark-haired figure; right: red-veiled, dark-haired figure carrying another. Bold, textured colors, minimalist style.

deviantart Flame Digital painting of a fiery dragon with glowing yellow eyes, black horns, and a long, sinuous tail, perched on a glowing, molten rock formation. The background is a gradient of dark purple to orange.

https://huggingface.co/circlestone-labs/Anima#natural-language-prompting-tips 自然语言提示技巧

  • 角色和系列名称遵循标准英文大小写规则。
  • 如果使用纯自然语言,描述越详细越好。至少写两句话。极短的提示可能会产生意外结果。
  • 你可以按任意顺序混合标签和自然语言。
  • 你可以在自然语言提示的开头放置质量/画师标签。
    • “masterpiece, best quality, @big chungus. An anime girl with medium-length blonde hair is…”
  • 命名一个角色,然后描述其基本外貌。
    • “Digital artwork of Fern from Sousou no Frieren, with long purple hair and purple eyes, wearing a black coat over a white dress with puffy sleeves…” - 当提示涉及多个角色时,这一点格外重要。如果仅列出角色名称而不描述外貌,模型可能会混淆。

https://huggingface.co/circlestone-labs/Anima#model-comparison 模型对比

你可能会对将Anima的输出与其他模型进行比较感兴趣。提供了一个ComfyUI工作流文件anima_comparison.json。该工作流生成一个图像网格:每个模型为一列,不同种子为行。通过更改几个输出节点,可以配置为比较任意数量的选定模型。支持的模型架构:Anima, SDXL, Lumina, Chroma, Newbie-Image。默认配置比较Anima、NetaYume和Newbie-Image。

https://huggingface.co/circlestone-labs/Anima#limitations 局限性

  • 模型不擅长写实。这是有意为之。它是一款专注于动漫/插画/艺术的模型。
  • 模型可能会生成不想要的内容,尤其是当提示很短或缺乏细节时。
    • 通过在正向和负向提示中使用适当的安全标签,并编写足够详细的提示,可以避免这种情况。
  • 模型在文字渲染方面表现不佳。通常能处理单个单词,有时也能处理短句,但较长的文字渲染效果不好。
  • 基础版是真正的基础模型。它未在精选数据集上进行美学调优。默认风格非常朴素中性,尤其是当你没有使用画师或质量标签时。

https://huggingface.co/circlestone-labs/Anima#finetuning-tips 微调技巧

  • 不要训练LLM适配器。 我的训练脚本diffusion-pipe允许你设置llm_adapter_lr=0来完全禁用它,示例配置默认就是如此。
    • 其他训练器如sd-scripts也有类似的选项,应被使用。
    • LLM适配器在文本嵌入到达扩散模型之前对其进行处理,因此对生成图像有巨大影响。适配器本身包含大量知识,很容易因训练而退化。
  • 使用较低的学习率。对于rank 32的LoRA,从2e-5开始,然后相应调整。
    • 作为基础模型,微调时无需克服激进的美学调优或RLHF。
    • 模型已经内置了极其庞大且多样的视觉概念。轻轻触碰即可。
  • 示例 (https://civitai.com/models/2536147) 是一个风格LoRA,附带数据集和配置共享。

https://huggingface.co/circlestone-labs/Anima#license 许可

本模型采用CircleStone Labs非商业许可。模型及其衍生品仅可用于非商业目的。此外,本模型构成Cosmos-Predict2-2B-Text2Image的“衍生模型”,因此受NVIDIA开放模型许可协议 (https://www.nvidia.com/en-us/agreements/enterprise-software/nvidia-open-model-license/) 中适用于衍生模型的部分约束。

如需商业许可,请发送邮件至 [email protected]

基于NVIDIA Cosmos构建。

相似文章

aisha-ai-official/animagine-xl-v4-opt

Replicate Explore

这是 Animagine XL v4 Opt 模型的页面,它是 Stable Diffusion XL 的一个开源微调模型,针对动漫风格图像生成进行了优化,可通过 Replicate 使用。

SeeSee21/Z-Anime

Hugging Face Models Trending

Z-Anime 是对阿里巴巴 Z-Image Base 模型进行全面微调的产物,专门用于高质量动漫生成,支持自然语言提示词,且显存占用较低。

nvidia/Cosmos3-Super-Text2Image

Hugging Face Models Trending

NVIDIA 发布了 Cosmos3-Super-Text2Image,这是一个文生图模型,属于 Cosmos3 全模态世界模型平台的一部分,用于物理 AI,使机器能够理解和模拟物理世界。

这就是 ChatGPT Images 2.0

YouTube AI Channels

OpenAI 发布 Imagen 2.0,这款 AI 图像生成器可以联网、推理、精准渲染文字,并一次性输出多张 2K 分辨率的多语言图像。