FLUX.2 [pro]
摘要
Black Forest Labs 发布了 Flux 2 Pro,一款全新的图像生成与编辑模型,在文本渲染、逼真度和角色一致性方面均有提升。该模型已通过 Replicate 的 API 提供。
FLUX.2 [pro] 可生成逼真的高分辨率图像,支持一致的多参考编辑、精准控制、角色一致性以及上下文感知的创意能力。
查看缓存全文
缓存时间: 2026/05/08 06:25
# FLUX.2 [pro] | 图像生成与编辑 API
来源:https://replicate.com/black-forest-labs/flux-2-pro
Flux 2 Pro 是 Black Forest Labs 推出的图像生成与编辑模型。它能根据文本提示生成高质量图像,也能通过自然语言指令编辑现有图像。该模型擅长处理复杂文字渲染、逼真细节,还能在多个参考图像之间保持角色或风格的一致性。
## 它能做什么
根据文字描述生成图像、编辑现有图像,或组合多张参考图像来创作新内容。该模型能理解详细指令,在 API 上最多可同时处理八张参考图像。
它的几个特别擅长的方面:
**文字渲染** – 模型能在图像中写出清晰可读的文字,包括复杂的排版、信息图表和用户界面原型。这在实际生产环境中很可靠,不限于简单场景。
**逼真效果** – 清晰的纹理、自然的光照和写实的细节使它适用于产品摄影、建筑可视化以及需要呈现真实照片感的场景。
**角色一致性** – 使用多张参考图像,在不同生成结果中保持同一角色、产品或风格。当需要一系列图像呈现统一外观时,这非常有帮助。
**结构化提示** – 可以使用 JSON 精确控制场景构图,包括相机角度、光照、调色板以及主体的位置。
## 如何使用
### 基础文生图
写出你想要内容的清晰描述。按重要性组织提示效果最佳:先主语,再动作、风格和背景。
例如:*“一辆银色时尚跑车在日落时分沿海公路飞驰,高动态范围,超写实”*
描述越具体,输出结果就越可预测。
### 编辑图像
上传一张图像,用自然语言描述要更改的内容。你可以引用图像的特定部分,或通过索引号指向其他参考图像。
例如:*“将背景替换为图像3中的海滩”* 或 *“让穿蓝色裙子的女士穿上红色夹克”*
### JSON 提示
如需精确控制,可以将提示结构化为 JSON 格式,包含 scene、subjects、style、lighting、camera、color\_palette 等字段。每个字段接受纯英文描述。
camera 字段可指定角度、距离、焦距、光圈和 ISO。color\_palette 字段接受十六进制色码或颜色名称来控制整体色调。
### 使用参考图像
你可以上传多张参考图像来引导生成过程。模型会利用这些图像理解风格、构图或你希望包含的特定元素。API 上总输入大小限制为 9 兆像素。
## 须知事项
**无负面提示** – 模型不理解像“不要文字”或“不要多余手指”这样的负面提示。如果你尝试使用它们,模型反而可能会添加你想避免的内容。相反,应描述你希望看到的内容。写 *“干净的背景,手自然放在画框外”* 而不是 *“不要杂乱的背景,不要多余的手指”*。
**颜色控制** – 可以在提示中使用十六进制色码来匹配精确颜色。这对品牌工作或需要特定颜色准确度的场景很有用。
**分辨率** – 模型可以编辑最高 4 兆像素分辨率的图像,同时保持细节和连贯性。
**多参考编辑** – 当使用多张参考图像时,可以通过索引号指向特定图像,告诉模型从何处使用哪些元素。
## 关于模型
Flux 2 Pro 采用潜在流匹配架构,将 Mistral-3 240 亿参数视觉语言模型与整流流变换器相结合。视觉语言模型提供真实世界知识和上下文,而变换器处理空间关系、材质和构图。该模型从头开始训练,使用新的潜在空间,同时优化图像质量和学习效率。
Black Forest Labs 以开放核心的方式构建了 Flux 2 Pro——同时发布用于研究和社区使用的开放权重模型,以及面向需要可靠性和规模团队的生产级端点。
## 获得更好结果的技巧
使用清晰、具体的语言。给出的细节越多,对输出的控制力就越强。
描述你想要的内容,而不是你不想要的。正面描述比试图排除某些东西要有效得多。
当你需要精确颜色时,尝试使用十六进制色码。
尝试使用多张参考图像来融合风格或在不同生成结果中保持一致性。
保持提示简洁但有描述性。你不需要写一大段——只需按优先级组织重要细节即可。
---
你可以在 Replicate 游乐场试用 Flux 2 Pro,地址为 replicate.com/playground (http://replicate.com/playground)
模型创建时间:5 个月 3 周前
模型更新时间:1 个月 2 周前
相似文章
UltraFlux:数据-模型协同设计实现多种宽高比下的高质量原生4K文本到图像生成
UltraFlux 提出了一种数据-模型协同设计方法,用于多种宽高比下的原生4K文本到图像生成,解决了位置编码、VAE压缩和优化挑战。它优于现有的开源基线,并达到了与 Seedream 4.0 等专有模型相当的水平。
FLUX3D: 基于扩散对齐稀疏表示的高保真3D高斯生成
FLUX3D引入了一个框架,通过利用扩散对齐的结构化潜变量和稀疏结构感知的扩散变压器来增强表示学习和跨模态对齐,实现高保真图像到3D高斯泼溅生成,取得了最先进的结果。
@Modular: Modular 现已在 @ArtificialAnlys 上线,图像生成速度比竞争对手快3倍。MAX推理服务运行 @bfl_ai…
根据 Artificial Analysis 的基准测试,Modular 的 MAX 推理服务在 FLUX.2-dev 上实现了比竞争对手快3倍的图像生成速度。
在 AskSary 体验 Flux 图像编辑——一句简单提示词带来的效果令人惊叹
AskSary 已将 Flux 图像编辑能力集成至其平台,为免费用户提供每月 8 次编辑额度,该功能具备出色的上下文理解能力,可实现基于提示词的像素级精准图像修改。
在一个单GPU上构建了开源的一提示生成电影级短片流程——使用FLUX.2 [klein]生成角色关键帧,Wan2.2-I2V生成动画,视觉评论器带自动重试,同一流程中集成音乐+9种语言旁白
构建了一个开源流程,仅需输入一句话即可生成带有角色、动画、音乐和旁白的电影级短片,使用FLUX.2、Wan2.2及其他模型,在单个AMD GPU上运行。该流程包含导演代理、角色生成、关键帧动画、视觉评论器、音乐和旁白等阶段。