隆重推出 FLUX.1 Kontext 与 BFL Playground

Black Forest Labs2025年5月29日大约 8 分钟

隆重推出 FLUX.1 Kontext 与 BFL Playground

今日，我们荣幸地发布 FLUX.1 Kontext ，这是一套创新的生成式流匹配模型，能够帮助用户生成和编辑图像。与现有的文本转图像模型不同， FLUX.1 Kontext 系列模型能够进行所谓 in-context 的图像生成，允许用户同时使用文本和图像作为输入提示，并能无缝提取和修改视觉概念，从而创造出全新的、协调一致的图像作品。

连贯、情境感知的图文生成与编辑。

您的图像、您的文字、您的世界。

FLUX.1 Kontext 通过整合即时文本图像编辑与文本生成图像功能，显著拓展了传统文本转图像模型的边界。作为一款多模态流模型，它融合了顶尖的角色一致性、上下文理解能力、局部编辑功能以及强大的文本转图像合成效果。

文本转图像功能再升级

无论是创意构思、草图绘制、概念设计，抑或纯粹娱乐，文本转图像始终是当今图像生成领域的核心环节。 FLUX.1 Kontext 模型具备业界领先的图像生成能力，不仅能精准遵循用户指令，呈现照片般逼真的渲染效果，还拥有极具竞争力的文字排版效果 —— 其推理速度更比肩当前主流模型（如 GPT-Image ）快至 8 倍。

尽情施展：玩转、创造、掌控……

FLUX.1 Kontext 模型的功能远不止于文本转图像。与以往那些仅支持纯文本生成的流模型不同， FLUX.1 Kontext 模型同样能够理解并基于现有图像进行创作。借助 FLUX.1 Kontext ，用户可以通过简单的文本指令修改输入图像，实现灵活、即时的图像编辑——无需进行 finetuning 或采用复杂的编辑流程。 FLUX.1 Kontext 套件的核心功能包括：

角色一致性：在不同场景和环境中，保持图像中独特元素（如参考角色或物体）的一致性。
局部编辑：对图像中的特定元素进行精准修改，而不影响其他部分。
风格参考：根据文本提示，在保留参考图像独特风格的同时生成全新场景。
交互速度：图像生成和编辑均具有极低的延迟。

……逐步迭代：精益求精

Flux.1 Kontext 允许用户迭代式地添加更多指令，并在先前编辑的基础上不断完善，以极低的延迟逐步优化创作，同时确保图像质量和角色一致性。

FLUX.1 Kontext [pro] 模型详解

作为 FLUX.1 Kontext 套件的一部分，我们为 BFL API 带来了两款全新的 in-context 图像模型。

FLUX.1 Kontext [pro] —— 快速迭代式图像编辑的先锋

这款单一模型具备 FLUX.1 标志性的卓越品质，能够实现局部编辑、生成式 in-context 修改以及经典的文本转图像功能。 FLUX.1 Kontext [pro] 同时支持文本和参考图像作为输入，能够轻松实现对特定图像区域的精准局部编辑以及对整个场景的复杂变换。其运行速度比以往的顶尖模型快一个数量级， FLUX.1 Kontext [pro] 堪称迭代编辑领域的先驱，因为它是首个允许用户在多次操作中基于先前编辑进行创作，并在不同场景和视角下保持角色、身份、风格和独有特征一致性的模型。

FLUX.1 Kontext [max] —— 高速运行下的极致性能

我们全新的实验性模型在遵循指令、文字排版生成以及编辑一致性方面均有显著提升，且丝毫未牺牲运行速度。

FLUX.1 Kontext [max] 和 FLUX.1 Kontext [pro] 现已登陆 KreaAI 、 Freepik 、 Lightricks 、 OpenArt 和 LeonardoAI 平台，并可通过我们的基础设施合作伙伴 FAL 、 Replicate 、 Runware 、 DataCrunch 、 TogetherAI 和 ComfyOrg 获取。我们还得到了 OpenArt 和 KreaAI 在偏好数据收集方面的支持。

FLUX.1 Kontext [dev] 版本开放私人测试 ( Private Beta )

我们坚信，开放研究和权重共享是确保技术安全创新的基石。为此，我们开发了一款开放权重的变体模型 FLUX.1 Kontext [dev] —— 这是一个轻量级的 12B 扩散型 Transformer 模型，易于定制，并与先前的 FLUX.1 [dev] 推理代码兼容。我们目前以私测版本 ( private beta release ) 的形式开放 FLUX.1 Kontext [dev] ，用于研究和安全测试。如果您对此感兴趣，请通过 kontext-dev@blackforestlabs.ai 与我们联系。公开发布后， FLUX.1 Kontext [dev] 将通过我们的合作伙伴 FAL 、 Replicate 、 Runware 、 DataCrunch 、 TogetherAI 和 HuggingFace 进行分发。

性能评估

为验证 FLUX.1 Kontext 系列模型的性能，我们进行了一项全面的性能评估，并已在一份技术报告中发布。简而言之：为评估我们的模型，我们整理了 KontextBench —— 一个基于众包真实世界用例的文本转图像和图像转图像生成基准测试。我们计划在未来发布此基准测试。

评估结果： 我们在六项 in-context 图像生成任务中展示了评估结果。 FLUX.1 Kontext [pro] 在所有任务中均名列前茅，并在文本编辑和角色保留方面取得了最高分。

我们评估了包括 FLUX.1 Kontext 模型在内的多款图像转图像模型在六项 KontextBench 任务中的表现。 FLUX.1 Kontext [pro] 在所有任务中均稳居顶尖水平，在文本编辑和角色保留方面得分最高（见上图），同时在推理速度方面也持续优于其他领先的同类模型（见下图）。

延迟对比： FLUX.1 Kontext 模型在文本转图像生成（左）和图像编辑（右）两方面，均展现出比同类顶尖模型更低的延迟。

我们从多个质量维度对 FLUX.1 Kontext 在文本转图像基准测试中的表现进行了评估。结果显示， FLUX.1 Kontext 模型在美学效果、指令遵循度、文字排版和真实感等各项基准测试中均表现出强劲的竞争力。

左图： 输入图像； 中图： 根据指令“将她的头转向镜头”编辑后的图像； 右图： “让她笑起来”的编辑效果。

左图： 输入图像； 中图： 根据指令“将 ‘YOU HAD ME AT BEER’ 改为 ‘YOU HAD ME AT CONTEXT’ ”编辑后的图像； 右图： “将场景更改为夜店”的编辑效果。

潜在局限

FLUX.1 Kontext 在当前版本中仍存在一些局限。过多的多轮编辑可能会引入 visual artifacts ，导致图像质量下降。在少数情况下，模型可能无法准确遵循指令，忽略特定的提示要求。此外，模型的“世界知识”储备有限，这会影响其生成符合上下文情景的准确内容的能力。同时， distillation 过程也可能引入 visual artifacts ，影响输出的保真度。

FLUX.1 Kontext 某一不足案例图示： 经过六轮迭代编辑后，生成的图像出现明显视觉质量下降和瑕疵。

FLUX API 演示：隆重推出 BFL Playground

自产品发布以来，我们持续收到用户反馈，希望能够更便捷地测试和演示我们的模型。为此，我们今天正式推出 FLUX Playground ：一个用于测试我们最先进 FLUX 模型的简化界面，无需进行复杂的技术集成。

Playground 能帮助开发者和团队验证应用场景，向相关方展示模型能力，并实时体验先进的图像生成技术。无论是评估技术可行性，还是向决策者展示成果， Playground 都提供了直接评估 FLUX 模型能力的途径，以便用户在全面部署 API 前进行充分考量。

在 BFL ，我们的使命是为媒体内容生成构建最顶尖的模型和基础设施。 Playground 是通往 BFL API 的门户，旨在加速从评估到生产部署的整个流程。即日起，您可以通过 https://playground.bfl.ai/ 访问。

我们的征程才刚刚开始。如果您希望加入我们的行列，共同实现这一使命，我们正在积极招聘各类优秀人才。欢迎通过此链接申请。