通过以下步骤,你可以用DALL·E 3生成任何想象的图像。
你可能听说过DALL·E 3,也可能没有。但如果你曾用ChatGPT生成图像,那么你已经使用过它。DALL·E 3是OpenAI开发的图像生成工具,用户只需输入文字描述即可生成几乎任何画面。此前版本需通过独立网站访问,而现在它已完全集成至ChatGPT和OpenAI的API平台,方便开发者将其嵌入自有软件。
与其他AI图像生成工具一样,DALL·E 3也面临争议——包括滥用风险,以及用于训练模型的数十亿张图像的版权问题。尽管如此,许多艺术家和设计师已将其融入工作流程,DALL·E 3目前是市场占有率最高的工具。
凭借简洁直观的界面和易用性,DALL·E 3位列我们最佳AI艺术生成工具榜单前列。ChatGPT付费用户每天可免费生成两幅图像,只需访问ChatGPT官网注册账号并输入文本指令即可。
但使用时仍需注意以下事项。本文将详解如何访问DALL·E 3、高效使用技巧,以及提升图像质量的方法。
DALL·E 3使用教程
DALL·E 3界面包含一个指令输入框,用于描述你想生成的图像(图片来源:ChatGPT)
DALL·E 3是ChatGPT内置的浏览器工具(也提供API供开发者调用)。在线使用需先注册账号,流程简单,验证邮箱或手机后即可开始。免费用户每天限生成两幅图像,频繁使用需订阅20美元/月的付费计划。
通过ChatGPT访问DALL·E 3时,操作非常直观。例如输入“印象派风格的宇航员骑马图”,点击生成后,DALL·E 3会输出图像。若初稿未达专业要求,通常迭代几次即可完善。
你可通过调整指令修改细节,满意后点击图像上的“下载”按钮保存至本地。
如何编写DALL·E 3指令
每个指令可生成四幅图像供选择(图片来源:ChatGPT)
操作虽简单,但获得理想结果需要技巧。简略指令易导致随机输出,建议尽可能详细描述:
写实图像:注明相机型号、焦距和灯光类型(如“影棚灯光”“柔光”“深阴影”)
风格调整:例如“加深棕色”可修正色彩寡淡的问题
指令越详细,结果越接近预期(图片来源:ChatGPT)
DALL·E 3进阶功能
图像变体生成
点击输入框的“+”上传图片,可生成变体或编辑(如“添加微笑”)(图片来源:ChatGPT)
画布扩展(Outpainting)
输入扩展比例(如“调整为16:9”),DALL·E 3会自动匹配原图风格填充背景(图片来源:ChatGPT)
此功能可用于扩展名画(如《蒙娜丽莎》)或自定义图像。
提升图像质量的技巧
DALL·E 3很少一次生成完美结果,你可能需要:
1细化指令:针对特定元素追加描述
2外部编辑:用Photoshop修复瑕疵(如扭曲的手指)
3分辨率限制:大幅打印需借助其他工具放大
注意:DALL·E 3对多主体构图表现较差,建议分步生成再合成。
DALL·E指令手册
Guy Parsons编写的指令手册提供详细创作指南(图片来源:The DALL·Ery GALL·Ery)
这份82页指南涵盖:
美学关键词(如“朦胧感”“动态构图”)
艺术史风格调用(如“新艺术运动风格”)
摄影参数(景深、视角)
核心建议:具体至上。模糊形容词可能被多义解读,明确需求是关键。
常见问题解答
DALL·E 3是什么?
基于机器学习的文本转图像工具,名称融合了“达利”和《机器人总动员》的“WALL-E”。第三代版本响应更快,但专业控制选项减少。同类工具有Stable Diffusion和Midjourney。
是否免费?
免费用户每日限2次,付费订阅(20美元/月)无限制。经济困难艺术家可申请补贴。
商用权限
测试版开放完整商用权利,但训练数据版权仍存争议。Getty Images已禁止AI内容上传。
限制与伦理
内容过滤:禁止生成暴力、仇恨符号等
多样性改进:未指定种族/性别时自动增加多样性
水印移除:旧版彩色方块标记已取消,可通过Content Credentials验证来源
API集成
开发者可用API将DALL·E 3嵌入应用,如微软Designer和Bing的Image Creator功能。
争议与未来
版权风险:训练数据合法性待立法明确
职业影响:可能重塑创意工作流程而非取代艺术家
滥用防范:OpenAI称已建立人工+自动监控系统
提示:在ChatGPT中使用时,明确要求“生成图像”以避免文本回复。服务器繁忙时响应可能需要2-3分钟。
精选文章: