FLUX.2 [pro]
摘要
Black Forest Labs 发布了 Flux 2 Pro,一款全新的图像生成与编辑模型,在文本渲染、逼真度和角色一致性方面均有提升。该模型已通过 Replicate 的 API 提供。
FLUX.2 [pro] 可生成逼真的高分辨率图像,支持一致的多参考编辑、精准控制、角色一致性以及上下文感知的创意能力。
查看缓存全文
缓存时间: 2026/05/08 06:25
# FLUX.2 [pro] | 图像生成与编辑 API
来源:https://replicate.com/black-forest-labs/flux-2-pro
Flux 2 Pro 是 Black Forest Labs 推出的图像生成与编辑模型。它能根据文本提示生成高质量图像,也能通过自然语言指令编辑现有图像。该模型擅长处理复杂文字渲染、逼真细节,还能在多个参考图像之间保持角色或风格的一致性。
## 它能做什么
根据文字描述生成图像、编辑现有图像,或组合多张参考图像来创作新内容。该模型能理解详细指令,在 API 上最多可同时处理八张参考图像。
它的几个特别擅长的方面:
**文字渲染** – 模型能在图像中写出清晰可读的文字,包括复杂的排版、信息图表和用户界面原型。这在实际生产环境中很可靠,不限于简单场景。
**逼真效果** – 清晰的纹理、自然的光照和写实的细节使它适用于产品摄影、建筑可视化以及需要呈现真实照片感的场景。
**角色一致性** – 使用多张参考图像,在不同生成结果中保持同一角色、产品或风格。当需要一系列图像呈现统一外观时,这非常有帮助。
**结构化提示** – 可以使用 JSON 精确控制场景构图,包括相机角度、光照、调色板以及主体的位置。
## 如何使用
### 基础文生图
写出你想要内容的清晰描述。按重要性组织提示效果最佳:先主语,再动作、风格和背景。
例如:*“一辆银色时尚跑车在日落时分沿海公路飞驰,高动态范围,超写实”*
描述越具体,输出结果就越可预测。
### 编辑图像
上传一张图像,用自然语言描述要更改的内容。你可以引用图像的特定部分,或通过索引号指向其他参考图像。
例如:*“将背景替换为图像3中的海滩”* 或 *“让穿蓝色裙子的女士穿上红色夹克”*
### JSON 提示
如需精确控制,可以将提示结构化为 JSON 格式,包含 scene、subjects、style、lighting、camera、color\_palette 等字段。每个字段接受纯英文描述。
camera 字段可指定角度、距离、焦距、光圈和 ISO。color\_palette 字段接受十六进制色码或颜色名称来控制整体色调。
### 使用参考图像
你可以上传多张参考图像来引导生成过程。模型会利用这些图像理解风格、构图或你希望包含的特定元素。API 上总输入大小限制为 9 兆像素。
## 须知事项
**无负面提示** – 模型不理解像“不要文字”或“不要多余手指”这样的负面提示。如果你尝试使用它们,模型反而可能会添加你想避免的内容。相反,应描述你希望看到的内容。写 *“干净的背景,手自然放在画框外”* 而不是 *“不要杂乱的背景,不要多余的手指”*。
**颜色控制** – 可以在提示中使用十六进制色码来匹配精确颜色。这对品牌工作或需要特定颜色准确度的场景很有用。
**分辨率** – 模型可以编辑最高 4 兆像素分辨率的图像,同时保持细节和连贯性。
**多参考编辑** – 当使用多张参考图像时,可以通过索引号指向特定图像,告诉模型从何处使用哪些元素。
## 关于模型
Flux 2 Pro 采用潜在流匹配架构,将 Mistral-3 240 亿参数视觉语言模型与整流流变换器相结合。视觉语言模型提供真实世界知识和上下文,而变换器处理空间关系、材质和构图。该模型从头开始训练,使用新的潜在空间,同时优化图像质量和学习效率。
Black Forest Labs 以开放核心的方式构建了 Flux 2 Pro——同时发布用于研究和社区使用的开放权重模型,以及面向需要可靠性和规模团队的生产级端点。
## 获得更好结果的技巧
使用清晰、具体的语言。给出的细节越多,对输出的控制力就越强。
描述你想要的内容,而不是你不想要的。正面描述比试图排除某些东西要有效得多。
当你需要精确颜色时,尝试使用十六进制色码。
尝试使用多张参考图像来融合风格或在不同生成结果中保持一致性。
保持提示简洁但有描述性。你不需要写一大段——只需按优先级组织重要细节即可。
---
你可以在 Replicate 游乐场试用 Flux 2 Pro,地址为 replicate.com/playground (http://replicate.com/playground)
模型创建时间:5 个月 3 周前
模型更新时间:1 个月 2 周前
相似文章
在 AskSary 体验 Flux 图像编辑——一句简单提示词带来的效果令人惊叹
AskSary 已将 Flux 图像编辑能力集成至其平台,为免费用户提供每月 8 次编辑额度,该功能具备出色的上下文理解能力,可实现基于提示词的像素级精准图像修改。
RuneXX/LTX-2.3-Workflows
该 Hugging Face 仓库提供了 Lightricks 的 LTX-2.3 视频生成模型的工作流和模型下载,专为与 ComfyUI 配合使用而设计,包括分割模型、GGUF 版本以及所需的自定义节点。
22 款 AI 图像模型成本分析(含 GPT Image 2)
最新成本分析显示,尽管速度提升有限,GPT Image 2 的价格却比前代便宜 7 倍;全新的 FLUX 2 系列也带来更经济的选择。
Qwen-Image-2.0 技术报告
Qwen-Image-2.0 是一个全新的图像生成基础模型,基于 Qwen3-VL 和多模态扩散 Transformer,将高保真合成与精确编辑能力统一起来。它在富含文本的内容、多语言排版以及照片级真实感生成方面表现卓越。
Fluent Frame
Fluent Frame是一款新工具,让用户能够像部署软件功能一样快速地发布精美的产品视频。