图片来源:VentureBeat,使用BFL Playground生成

由Stable Diffusion热门模型创造者创立的初创公司Black Forest Labs(BFL)近日推出了名为FLUX.1 Kontext的新图像生成模型。该模型不仅能生成和编辑照片,还允许用户通过文字和其他图像进行修改。

该公司还宣布推出全新的BFL Playground平台,用户可在企业应用前先行体验BFL的模型。

BFL发布了该模型的两个版本:FLUX.1 Kontext [pro]和FLUX.1 Kontext [max]。第三个版本FLUX.1 Kontext [dev]将作为私有测试版发布。Pro和Max版本现已登陆KreaAI、Freepik、Lightricks、OpenArt和LeonardoAI等平台,助力企业创意团队和开发者实现精准高效的图像编辑。

FLUX.1 Kontext支持上下文生成技术,意味着模型可根据提供的参考素材或场景进行创作,而非完全从零开始生成。

该公司在X平台的推文中指出Kontext的四大特性:

角色一致性:跨场景保持元素连贯

局部编辑:精准修改特定区域不影响整体

风格参考:基于现有风格生成场景

极低延迟

开发者可通过BFL Playground测试用例并体验模型,再接入完整BFL API。

Pro与Max版本解析

企业用户可使用Pro版本进行快速迭代编辑。该版本支持文字与参考图像双重输入及局部修改。BFL表示Kontext [pro]的运行速度"比现有先进模型快一个数量级",且是首批支持多轮编辑的模型之一。

FLUX.1 Kontext [max]则是性能更强的极速版本,在保持响应速度的同时,能更精准遵循指令、优化文字可读性并确保编辑一致性。

当前市场上,MidJourney的AI图像编辑器和Adobe Firefly等工具同样支持基于参考图的区域编辑功能。

FLUX.1 Kontext [dev]作为该系列第三个版本,是参数达120亿的开源权重模型。

生成式流技术

BFL表示FLUX.1 Kontext采用流模型架构,使其能更灵活完成上述任务。这种模型通过持续数据流学习,在噪声数据与有效信息间建立路径,不同于Stability AI、MidJourney乃至OpenAI Sora等采用的"去噪"扩散模型。

BFL在博客中强调:"FLUX.1 Kontext突破了文生图局限。相较于仅支持纯文本生成的流模型,它能理解现有图像并据此创作。用户通过简单文字指令即可修改输入图像,无需复杂调参或编辑流程。"

在文生图基准测试中,BFL宣称FLUX.1 Kontext在美学表现、指令遵循、真实感及文字处理方面均可媲美主流模型。

市场反响

BFL去年十月已发布文生图模型Flux 1.1 Pro及配套API。目前通过BFL Playground体验Kontext模型的用户反馈积极。

当然,该模型仍需与持续迭代的成熟图像生成工具展开竞争。

精选文章:

Z世代希望AI发挥其实用性,而非噱头

诺曼·福斯特:如何成就建筑史上最辉煌的职业生涯

首尔摄影艺术博物馆启幕:以扭曲动感立面重塑城市景观

AI虚拟网红正在重塑Z世代的消费选择

埃及创意人为何集体回归书法艺术?