深度解析创意AI的起源、运作、争议与未来
2018年,一幅名为《埃德蒙·德·贝拉米》的肖像画在纽约拍出43.25万美元高价。令人惊讶的是,这幅画并非出自人类艺术家之手,而是由学习过数千幅古典肖像的AI算法创作。同年,艺术家马里奥·克林格曼的《路人记忆I》以4万英镑(约5.38万美元)成交。若你认为AI仅局限于绘画领域,那就错了——它已进军写作、音乐甚至建筑等创意领域。2018年,罗斯·古德温的《1号公路》成为首部完全由AI撰写的小说;音乐领域,OpenAI的Jukebox和SunoAI的Bark即将颠覆行业;建筑方面,机器人建造的3D打印装置《代达罗斯亭(2016)》同样引人注目。
这些案例仅是AI在创意产业的初试啼声。随着技术持续进化,未来更成熟的AI软件会带来什么?它会彻底取代人类创造力吗?创意AI将走向何方?它如何诞生?我们又面临哪些争议?人机协作会催生怎样的成果?本文将一一探讨。
创意AI的起源
历史上,机械取代的多是重复性劳动,而写作、艺术等创意工作长期未被技术撼动。但Midjourney、Dall·E等工具并非横空出世——AI艺术的萌芽可追溯至数十年前。1970年代,艺术家哈罗德·科恩开发了早期艺术生成程序AARON,能创作抽象画作。1979年,它在旧金山现代艺术博物馆完成了百米壁画。2014年,AI艺术系统迎来突破:计算机科学家伊恩·古德费洛提出生成对抗网络(GANs),至今仍是许多艺术生成系统的核心。2015年问世的神经风格迁移技术,通过融合图像风格与内容首次引发公众关注。2018年,基于GANs的《埃德蒙·德·贝拉米》拍卖成功;2021年,OpenAI推出首个文本生成图像模型Dall·E,掀起AI图像革命;2022年,首个开源AI图像工具Stable Diffusion面世。如今,新旧工具正持续迭代,争夺市场。
GANs生成的肖像《埃德蒙·德·贝拉米》以43.25万美元成交。图片来源:Obvious Collective(教育用途)
创意AI如何运作?(图像生成模型篇)
创意AI本质上是生成式AI的分支。以最早的GANs系统为例:它由生成器与判别器组成。生成器试图制造逼真图像,判别器则区分真实图像(来自训练数据)与生成器的"赝品"。通过判别器的持续反馈,生成器不断优化,直至能以假乱真。
GANs简化流程:生成器创作→判别器批判→生成器改进
而Stable Diffusion、Dall·E等工具依赖的扩散模型,可用米开朗基罗的名言诠释:
"每块大理石都藏着一尊雕像,雕塑家的任务是发现它。"
AI图像生成器如同画家,但它的画布初始布满电视雪花般的噪点(高斯噪声)。通过逐步去噪,最终呈现符合文字指令的图像。这一能力源自训练——模型学习过数百万张图像的加噪与去噪过程。当输入"海上落日"等指令时,模型便从混沌中雕琢出你想象的画面。为确保图像贴合指令,多数扩散模型采用CLIP(对比语言-图像预训练)系统作为引导。
用户指令:"海上落日"(Dall·E 3生成)
创意AI的挑战、争议与伦理
AI工具的创造力与日俱增,有人欢呼这场革命,也有人忧心忡忡。当曾被视为人类专属的创造力被AI挑战,创意从业者正目睹职业受到威胁。
伴随强大能力而来的是责任。AI艺术的版权与知识产权首当其冲:模型训练依赖海量网络数据。2023年1月,Getty Images起诉Stability AI,指控其擅自使用1200万张图片训练模型;同年,多位视觉艺术家集体诉讼AI公司未经授权使用其作品。
更深层的争议关乎原创性。严格来说,AI艺术并非完全原创——它提取训练数据中的模式,混合生成"不存在"的新作品。这引发对创造力本质的叩问:当AI能模仿创意时,创造力究竟是什么?当AI完成惊艳作品,真正的创作者是AI还是输入指令的人类?这些问题尚无定论,值得深思。
创意AI的未来
无人能精准预言AI的进化轨迹,但可确定它将与量子计算、AR/VR、Web3等前沿技术结合,形成"强大到可怕"的合力。当前已有电影人、动画师借助AI优化流程,若技术完全成熟,行业将迎来巨变。
但AI不会扼杀人类创造力。正如Netflix CEO泰德·萨兰多斯所言:"AI将降低讲好故事的成本,而非取代创意。"未来,AI不仅服务于工作室,更将渗透日常生活——从洗碗机器人到自动洗衣系统,可能性无穷无尽。
结语
AI很可能将创意游戏提升至全新维度,但不会完全取代人类艺术。AI没有情感、灵魂与真正的想象力,仅能基于模式生成作品,无法传递目的性与真情实感;而人类艺术家通过创作表达情绪与意义。
试想当创意人与AI协作:艺术家提供情感内核,AI作为工具精炼作品、激发灵感,二者合力必将诞生非凡之作。
迈向未来时,我们需审慎运用与塑造AI。创意之未来已握于手中,但核心问题仍是:我们将AI视为创作工具,还是任由它重新定义"创意"本身?
精选文章: