Krea 2 在 Hugging Face 上发布
摘要
Krea 2 是一个拥有120亿参数的文本到图像扩散模型,以开放权重形式在 Hugging Face 上发布,提供了 Raw(基础版)和 Turbo(后训练版)检查点。
查看缓存全文
缓存时间: 2026/06/23 16:09
krea/Krea-2-Raw · Hugging Face
来源:https://huggingface.co/krea/Krea-2-Raw
https://huggingface.co/krea/Krea-2-Raw#krea-2-text-to-image-modelKrea 2 文本到图像模型
这是 Krea 2 Raw 检查点,不推荐用于推理。它是针对您自身需求和领域进行微调或后训练的绝佳基础。例如,一个用例是在 midtrain 上训练 LoRA,然后直接在 Krea 2 Turbo 上使用它们。请参阅我们内部训练的 LoRA 集合,这些 LoRA 在 Raw 上训练并旨在与 Turbo 一起使用:Krea-2 LoRA 集合 (https://huggingface.co/collections/krea/krea-2-loras)
Krea 2 示例输出 (https://huggingface.co/krea/Krea-2-Raw/blob/main/images/header.jpg)
https://huggingface.co/krea/Krea-2-Raw#inference-with-diffusers使用 Diffusers 进行推理
从源码安装 diffusers(用于 Krea2Pipeline):
pip install git+https://github.com/huggingface/diffusers.git
`` import torch from diffusers import Krea2Pipeline
pipe = Krea2Pipeline.from_pretrained(“krea/Krea-2-Raw”, torch_dtype=torch.bfloat16).to(“cuda”) image = pipe(“雪中的狐狸”, num_inference_steps=52, guidance_scale=3.5).images[0] image.save(“krea2.png”) ``
https://huggingface.co/krea/Krea-2-Raw#inference-with-sglang使用 SGLang 进行推理
从源码安装 SGLang (https://github.com/sgl-project/sglang)
通过 CLI:
sglang generate --model-path krea/Krea-2-Raw \ --prompt "一只红狐坐在新雪中,黄金时刻,照片级真实感" \ --num-inference-steps 52 --height 1024 --width 1024 --guidance-scale 3.5 --save-output
查看完整的 SGLang Krea 2 食谱,请点击此处 (https://docs.sglang.io/cookbook/diffusion/Krea/Krea-2)
https://huggingface.co/krea/Krea-2-Raw#model-overview模型概述
- **模型名称:**Krea 2
- **版本:**v1.0
- **发布日期:**2026年6月22日
- **模型类型:**文本到图像扩散模型
- **架构:**扩散变换器,参数规模120亿
- **许可证:**Krea 2 社区许可证
- **发布格式:**开放权重发布和 Krea 托管的产品集成
- **模型开发者:**Krea.ai, Inc.
https://huggingface.co/krea/Krea-2-Raw#model-family-and-release-checkpoints模型家族与发布检查点
本模型卡涵盖 Krea 2 模型家族,包括以下发布检查点:
- **Krea 2 Raw:**基础发布检查点,在额外的后训练和微调之前。
- **Krea 2 Turbo:**经过后训练的发布检查点,包含额外的微调和蒸馏。
https://huggingface.co/krea/Krea-2-Raw#capabilities-and-intended-use能力与预期用途
Krea 2 是一个文本到图像的扩散模型,能够根据自然语言文本描述生成图像。该模型旨在支持创意、商业、开发者和研究用例,包括图像生成、概念构思、设计探索、视觉制作工作流程,以及集成到应用程序和创意工具中。
https://huggingface.co/krea/Krea-2-Raw#out-of-scope-uses超出范围的使用
本模型不适用于或设计用于以下情况:违反适用法律法规;侵犯或盗用第三方权利;生成或促进非法或有害内容(包括 CSAM、NCII、骚扰或诽谤);或支持对个人法律权利产生不利影响的完全自动化决策。此总结并非详尽无遗。Krea 2 的使用受 Krea 2 社区许可协议约束,且必须遵守可接受使用政策。如有任何冲突,以 Krea 可接受使用政策和 Krea 2 社区许可证为准。
https://huggingface.co/krea/Krea-2-Raw#training-data训练数据
本模型使用了公开可用数据、从第三方提供商处许可的数据以及通过专有方法生成的合成数据的组合进行开发。训练数据包括图像及其相关标题或文本描述。
在训练之前,对数据进行了过滤,以移除某些类别的有害内容,并减少低质量、重复或不相关数据。Krea 还使用了精选和合成的训练数据,以改进提示遵循、视觉质量以及与预期用例的一致性。
https://huggingface.co/krea/Krea-2-Raw#safety-measures安全措施
我们在整个模型开发生命周期中实施了安全措施。我们应用了有针对性的微调技术,以减少模型对直接和对抗性提示生成有害内容的敏感性,并在发布前进行了多轮内部和外部安全评估。
对于 Krea 托管产品中集成了 Krea 2 的部分,我们使用专有和第三方检测工具的组合部署输入和输出分类器,以标记或阻止违反政策的提示和生成的图像。
由于这也是一个开放权重发布,Krea 无法控制模型的下游部署。根据 Krea 2 社区许可证,部署者需要实施内容过滤措施或等效的审查流程,以防止根据其用例生成或分发非法或违反政策的内容。未能实施所需保障措施的部署者即违反许可证。详情请参阅许可证。
我们在发布前进行了多轮内部和外部安全评估,包括为评估模型对试图生成有害或违反政策输出的抵抗能力而设计的对抗性测试。测试涵盖了性露骨内容、非自愿亲密图像、儿童安全风险和其他高风险内容类别。基于这些评估,发布的检查点在测试的风险类别中表现出对违规输入的高抵抗性。
Krea 维护报告渠道,用于报告有害、非法或违反政策的输出,邮箱为 [email protected]。涉及潜在 CSAM 的报告将依法上报给 NCMEC。Krea 保留在发现滥用模式时更新模型权重或撤销访问权限的权利。
https://huggingface.co/krea/Krea-2-Raw#risks-and-limitations风险与限制
Krea 2 是一项新技术,其使用存在风险。目前进行的测试尚未涵盖,也无法涵盖所有可能的场景。模型的潜在输出无法提前预测,在某些情况下可能会产生不准确、有争议或其他不理想的输出。
本模型不旨在提供事实信息。模型可能无法生成与提示匹配的输出,并且提示遵循可能受到提示风格、具体性、语言和措辞的影响。
在使用该模型部署任何应用程序之前,开发人员应为其特定应用程序进行安全测试和调整,并且必须实施 Krea 2 社区许可证要求的保障措施。
https://huggingface.co/krea/Krea-2-Raw#license-and-outputs许可证与输出
Krea 不对本模型用户生成的内容主张版权或其他知识产权。用户对其输出以及后续对输出内容的任何使用承担全部责任。与其他生成工具一样,用户输入的性质会影响产生的输出,提示可能生成涉及第三方权利的图像。用户有责任评估和处理这些风险。更多信息请参阅 Krea 2 社区许可证。
https://huggingface.co/krea/Krea-2-Raw#reporting报告
要报告此模型生成的有害、非法或违反政策的输出:
涉及潜在 CSAM 的报告将依法上报给国家失踪与受虐儿童中心 (NCMEC)。
https://huggingface.co/krea/Krea-2-Raw#contact联系方式
- 一般咨询:[email protected]
- 安全与滥用:[email protected]
- **模型卡版本:**1.0
- **最后更新:**2026年6月22日
相似文章
Krea 2
Krea 2 是一款为增强风格控制和情绪板创建而发布的图像模型。
@HuggingPapers:微软刚刚在Hugging Face上发布了Lens,一个38亿参数的文本到图像模型,提供高效训练和高…
微软在Hugging Face上发布了Lens,一个38亿参数的文本到图像模型,支持高效训练和高达1440×1440的高分辨率生成。
@ClementDelangue:OpenAI 今天在 HF 上新发布了一个模型!
OpenAI 今天在 Hugging Face 发布了一个新模型。
i1:一个简单且完全开放的强文本到图像模型配方
本文介绍了i1,一个3B参数的文本到图像扩散模型,在性能上与领先的闭源模型竞争,同时完全开放(权重、数据、代码)。它提供了来自300多项控制实验的见解,并为开放研究提供了实用配方。
RecGen 1 & 2:全新发布的图像转3D模型AI,达到业界领先水平,可能开源。
RecGen 1 和 2 是全新发布的AI模型,声称在将图像转换为3D模型方面达到了业界领先的性能,并且有可能开源。