FLUX.2 [pro]

Replicate Explore 模型

摘要

Black Forest Labs 发布了 Flux 2 Pro,一款全新的图像生成与编辑模型,在文本渲染、逼真度和角色一致性方面均有提升。该模型已通过 Replicate 的 API 提供。

FLUX.2 [pro] 可生成逼真的高分辨率图像,支持一致的多参考编辑、精准控制、角色一致性以及上下文感知的创意能力。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/08 06:25

# FLUX.2 [pro] | 图像生成与编辑 API 来源:https://replicate.com/black-forest-labs/flux-2-pro Flux 2 Pro 是 Black Forest Labs 推出的图像生成与编辑模型。它能根据文本提示生成高质量图像,也能通过自然语言指令编辑现有图像。该模型擅长处理复杂文字渲染、逼真细节,还能在多个参考图像之间保持角色或风格的一致性。 ## 它能做什么 根据文字描述生成图像、编辑现有图像,或组合多张参考图像来创作新内容。该模型能理解详细指令,在 API 上最多可同时处理八张参考图像。 它的几个特别擅长的方面: **文字渲染** – 模型能在图像中写出清晰可读的文字,包括复杂的排版、信息图表和用户界面原型。这在实际生产环境中很可靠,不限于简单场景。 **逼真效果** – 清晰的纹理、自然的光照和写实的细节使它适用于产品摄影、建筑可视化以及需要呈现真实照片感的场景。 **角色一致性** – 使用多张参考图像,在不同生成结果中保持同一角色、产品或风格。当需要一系列图像呈现统一外观时,这非常有帮助。 **结构化提示** – 可以使用 JSON 精确控制场景构图,包括相机角度、光照、调色板以及主体的位置。 ## 如何使用 ### 基础文生图 写出你想要内容的清晰描述。按重要性组织提示效果最佳:先主语,再动作、风格和背景。 例如:*“一辆银色时尚跑车在日落时分沿海公路飞驰,高动态范围,超写实”* 描述越具体,输出结果就越可预测。 ### 编辑图像 上传一张图像,用自然语言描述要更改的内容。你可以引用图像的特定部分,或通过索引号指向其他参考图像。 例如:*“将背景替换为图像3中的海滩”* 或 *“让穿蓝色裙子的女士穿上红色夹克”* ### JSON 提示 如需精确控制,可以将提示结构化为 JSON 格式,包含 scene、subjects、style、lighting、camera、color\_palette 等字段。每个字段接受纯英文描述。 camera 字段可指定角度、距离、焦距、光圈和 ISO。color\_palette 字段接受十六进制色码或颜色名称来控制整体色调。 ### 使用参考图像 你可以上传多张参考图像来引导生成过程。模型会利用这些图像理解风格、构图或你希望包含的特定元素。API 上总输入大小限制为 9 兆像素。 ## 须知事项 **无负面提示** – 模型不理解像“不要文字”或“不要多余手指”这样的负面提示。如果你尝试使用它们,模型反而可能会添加你想避免的内容。相反,应描述你希望看到的内容。写 *“干净的背景,手自然放在画框外”* 而不是 *“不要杂乱的背景,不要多余的手指”*。 **颜色控制** – 可以在提示中使用十六进制色码来匹配精确颜色。这对品牌工作或需要特定颜色准确度的场景很有用。 **分辨率** – 模型可以编辑最高 4 兆像素分辨率的图像,同时保持细节和连贯性。 **多参考编辑** – 当使用多张参考图像时,可以通过索引号指向特定图像,告诉模型从何处使用哪些元素。 ## 关于模型 Flux 2 Pro 采用潜在流匹配架构,将 Mistral-3 240 亿参数视觉语言模型与整流流变换器相结合。视觉语言模型提供真实世界知识和上下文,而变换器处理空间关系、材质和构图。该模型从头开始训练,使用新的潜在空间,同时优化图像质量和学习效率。 Black Forest Labs 以开放核心的方式构建了 Flux 2 Pro——同时发布用于研究和社区使用的开放权重模型,以及面向需要可靠性和规模团队的生产级端点。 ## 获得更好结果的技巧 使用清晰、具体的语言。给出的细节越多,对输出的控制力就越强。 描述你想要的内容,而不是你不想要的。正面描述比试图排除某些东西要有效得多。 当你需要精确颜色时,尝试使用十六进制色码。 尝试使用多张参考图像来融合风格或在不同生成结果中保持一致性。 保持提示简洁但有描述性。你不需要写一大段——只需按优先级组织重要细节即可。 --- 你可以在 Replicate 游乐场试用 Flux 2 Pro,地址为 replicate.com/playground (http://replicate.com/playground) 模型创建时间:5 个月 3 周前 模型更新时间:1 个月 2 周前

相似文章

RuneXX/LTX-2.3-Workflows

Hugging Face Models Trending

该 Hugging Face 仓库提供了 Lightricks 的 LTX-2.3 视频生成模型的工作流和模型下载,专为与 ComfyUI 配合使用而设计,包括分割模型、GGUF 版本以及所需的自定义节点。

Qwen-Image-2.0 技术报告

Hugging Face Daily Papers

Qwen-Image-2.0 是一个全新的图像生成基础模型,基于 Qwen3-VL 和多模态扩散 Transformer,将高保真合成与精确编辑能力统一起来。它在富含文本的内容、多语言排版以及照片级真实感生成方面表现卓越。

Fluent Frame

Product Hunt

Fluent Frame是一款新工具,让用户能够像部署软件功能一样快速地发布精美的产品视频。