通过以下步骤,你可以用DALL·E 3生成任何想象的图像。

你可能听说过DALL·E 3,也可能没有。但如果你曾用ChatGPT生成图像,那么你已经使用过它。DALL·E 3是OpenAI开发的图像生成工具,用户只需输入文字描述即可生成几乎任何画面。此前版本需通过独立网站访问,而现在它已完全集成至ChatGPT和OpenAI的API平台,方便开发者将其嵌入自有软件。

与其他AI图像生成工具一样,DALL·E 3也面临争议——包括滥用风险,以及用于训练模型的数十亿张图像的版权问题。尽管如此,许多艺术家和设计师已将其融入工作流程,DALL·E 3目前是市场占有率最高的工具。

凭借简洁直观的界面和易用性,DALL·E 3位列我们最佳AI艺术生成工具榜单前列。ChatGPT付费用户每天可免费生成两幅图像,只需访问ChatGPT官网注册账号并输入文本指令即可。

但使用时仍需注意以下事项。本文将详解如何访问DALL·E 3、高效使用技巧,以及提升图像质量的方法。

DALL·E 3使用教程

DALL·E 3界面包含一个指令输入框,用于描述你想生成的图像(图片来源:ChatGPT)

DALL·E 3是ChatGPT内置的浏览器工具(也提供API供开发者调用)。在线使用需先注册账号,流程简单,验证邮箱或手机后即可开始。免费用户每天限生成两幅图像,频繁使用需订阅20美元/月的付费计划。

通过ChatGPT访问DALL·E 3时,操作非常直观。例如输入“印象派风格的宇航员骑马图”,点击生成后,DALL·E 3会输出图像。若初稿未达专业要求,通常迭代几次即可完善。

你可通过调整指令修改细节,满意后点击图像上的“下载”按钮保存至本地。

如何编写DALL·E 3指令

每个指令可生成四幅图像供选择(图片来源:ChatGPT)

操作虽简单,但获得理想结果需要技巧。简略指令易导致随机输出,建议尽可能详细描述:

写实图像:注明相机型号、焦距和灯光类型(如“影棚灯光”“柔光”“深阴影”)

风格调整:例如“加深棕色”可修正色彩寡淡的问题

指令越详细,结果越接近预期(图片来源:ChatGPT)

DALL·E 3进阶功能

图像变体生成

点击输入框的“+”上传图片,可生成变体或编辑(如“添加微笑”)(图片来源:ChatGPT)

画布扩展(Outpainting)

输入扩展比例(如“调整为16:9”),DALL·E 3会自动匹配原图风格填充背景(图片来源:ChatGPT)
此功能可用于扩展名画(如《蒙娜丽莎》)或自定义图像。

提升图像质量的技巧

DALL·E 3很少一次生成完美结果,你可能需要:

1细化指令:针对特定元素追加描述

2外部编辑:用Photoshop修复瑕疵(如扭曲的手指)

3分辨率限制:大幅打印需借助其他工具放大

注意:DALL·E 3对多主体构图表现较差,建议分步生成再合成。

DALL·E指令手册

Guy Parsons编写的指令手册提供详细创作指南(图片来源:The DALL·Ery GALL·Ery)
这份82页指南涵盖:

美学关键词(如“朦胧感”“动态构图”)

艺术史风格调用(如“新艺术运动风格”)

摄影参数(景深、视角)

核心建议:具体至上。模糊形容词可能被多义解读,明确需求是关键。

常见问题解答

DALL·E 3是什么?

基于机器学习的文本转图像工具,名称融合了“达利”和《机器人总动员》的“WALL-E”。第三代版本响应更快,但专业控制选项减少。同类工具有Stable Diffusion和Midjourney。

是否免费?

免费用户每日限2次,付费订阅(20美元/月)无限制。经济困难艺术家可申请补贴。

商用权限

测试版开放完整商用权利,但训练数据版权仍存争议。Getty Images已禁止AI内容上传。

限制与伦理

内容过滤:禁止生成暴力、仇恨符号等

多样性改进:未指定种族/性别时自动增加多样性

水印移除:旧版彩色方块标记已取消,可通过Content Credentials验证来源

API集成

开发者可用API将DALL·E 3嵌入应用,如微软Designer和Bing的Image Creator功能。

争议与未来

版权风险:训练数据合法性待立法明确

职业影响:可能重塑创意工作流程而非取代艺术家

滥用防范:OpenAI称已建立人工+自动监控系统

提示:在ChatGPT中使用时,明确要求“生成图像”以避免文本回复。服务器繁忙时响应可能需要2-3分钟。

精选文章:

人工智能会引发一场认知革命,最终导致平庸与趋同吗?

透明设计:透视材料如何重塑建筑与产品设计

网页设计的消亡:为什么网站很快就会自动设计

2025年的极简主义设计:进化而非消亡

AI正在重塑创作者经济——数字内容会失去人情味吗?