Freepik公司推出全新文生图模型"F Lite",该模型仅采用版权安全素材训练,旨在成为Midjourney等争议性生成器的合法替代品,为研究领域提供法律保障。

这款最新生成式AI模型拥有约100亿参数,其训练数据完全来自Freepik自有图库的商业授权图片。据官方宣称,F Lite是首个完全基于"安全内容"构建的公开可用大规模模型。

F Lite由Freepik与AI初创公司Fal.ai合作开发,在64块NVIDIA H100 GPU上历时两月完成训练,所用内部数据集包含约8000万张图片。

随着Adobe、Getty Images和Shutterstock等公司相继推出基于合法审核数据的图像生成器,Freepik也加入了这一行列。这场"版权安全训练集"运动兴起之际,OpenAI和Midjourney等公司正因使用网络爬取图像面临诉讼浪潮。

与部分竞品不同,Freepik将F Lite定位为开发者可二次开发的开放模型。GitHub仓库已公开代码(需配备24GB显存GPU运行),同时提供Hugging Face体验版。

人类反馈优化图像质量

得益于Freepik图库的训练数据,F Lite在生成插画和矢量风格作品时表现优异。但在处理照片级写实图像时,该模型仍存在明显缺陷:皮肤纹理、织物细节经常缺失,复杂解剖结构易出现失真。由于主要使用长文本描述训练,模型对简短提示词响应不佳,图像内文字渲染仍是当前技术难点。

相同提示词在Midjourney中生成的图像具有艺术质感,几乎看不出AI痕迹 | 图片来源:THE DECODER测试生成

公司表示这些局限源于训练数据集规模与算力投入。根据扩散模型的规模效应定律,图像质量与细节表现将随数据量和训练时长显著提升。

Freepik的素材库与AI工具布局

这家西班牙公司专注为设计师、企业和创意人士提供授权数字素材,其平台包含矢量图、照片、插画、图标及演示模板等海量资源,部分内容可免费使用。近年Freepik持续加码AI工具研发,已推出自动图像编辑、内容生成等功能,如今又新增合成图像生成服务。

精选文章:

伟大的认知迁移:人工智能如何重塑人类的目的、工作和意义

人工智能人才:未来就在眼前!

Bolon「出埃及记」:编织地板的奇幻迁徙之旅

经典电影变身复古书封:一场跨媒介的视觉狂欢

单色房间太单调?这些技巧让它高级感拉满