在孟加拉文化中,《苏芭》是诺贝尔文学奖得主泰戈尔1892年创作的短篇小说,讲述了一位哑女的故事。"关于《苏芭》的视觉参考资料几乎为零",前新闻摄影师桑卡·卡尔说,"这个故事长期以文字形式存在"。
如今在美国攻读硕士学位的奈特学者卡尔,决定用图像呈现这个经典故事——村庄里的哑女如何用眼神和手势表达自我。他发现全球图库中独特文化、种族和地域元素的呈现严重不足,而人工智能(AI)生成的面孔往往"偏西方化"或流于泛泛。
卡尔分享了如何通过研究《苏芭》来优化AI指令,确保文化准确性。这种方法或可广泛应用于儿童故事、民间传说和世界文学经典的视觉化呈现。"我的目标是创造尽可能真实的人物形象,"卡尔说,"就像奥斯卡获奖历史片对视觉细节的严谨还原。"
桑卡·卡尔是谁?
这位自诩"硬核摄影师"的印度人,曾为印度和阿联酋的新闻媒体工作,并担任路透社自由撰稿人。
桑卡·卡尔
2024-25学年,他获得俄亥俄大学奈特基金会全额资助的研究员资格。3月21日,卡尔向由国际知名作家/设计师阿多尼斯·杜拉多和视觉记者约什·伯恩鲍姆、特伦斯·雷默组成的学术委员会提交了硕士项目。"高等教育中尚未出现类似的应用生成式AI研究",杜拉多副教授评价道。
来自印度西孟加拉邦的卡尔,其家乡正是泰戈尔《苏芭》的故事背景地。这位1913年诺贝尔文学奖得主的作品,至今仍是学校教材和艺术节庆的重要内容。
为AI注入文化基因
为还原19世纪末孟加拉人的服饰特征、体貌细节与乡村环境,卡尔研究了:
殖民时期照片,包括1863年赴印度的英国摄影师塞缪尔·伯恩的作品:"这些影像帮助我构建当时的房屋、船只、景观与日常生活"
美国国会图书馆和印度国家档案馆的旧画作与插图
奥斯卡终身成就奖得主萨蒂亚吉特·雷伊的孟加拉语电影
展现传统服饰、珠宝、婚俗与乡村生活的在线文化遗产
AI指令的艺术
基于档案研究与家乡生活经验,卡尔手动调整Midjourney和Adobe Firefly的生成结果。他的指令细致入微:
技术局限与文化责任
当前AI工具虽已广泛应用于图书出版与插画领域——《卫报》2023年12月26日就刊发过《丈夫用AI给孩子编睡前故事令我震惊》的评论。但卡尔发现,AI对孟加拉地貌、面部特征、传统服饰的呈现仍不尽如人意。
"Midjourney和Adobe Firefly难以准确生成19世纪孟加拉服饰,"他指出,"当我描述现代服装时,AI表现明显更好,这暴露出训练数据对当代时尚的偏好。"
卡尔预测,随着技术发展,生成式AI表现文化细节的能力将提升。"未来AI可能不再需要如此精细的人工引导。但今天的项目正是这种进步的基石,"他强调,"这不是技术缺陷,而是成长的必经阶段。"
在探索提升AI历史准确性的方法时,卡尔联想到艺术与技术之争的古老命题。他提及法国画家保罗·德拉罗什1840年对摄影术的恐慌:"从今天起,绘画死了。"对此卡尔沉思道:"摄影没有杀死绘画,它拓展了视觉语言。历史告诉我们,每种新工具在冲击传统的同时,也重塑着传统的边界。"
桑卡·卡尔通过AI生成的苏芭年龄变化影像
对卡尔而言,他正用生成式AI向世界展现那个不用言语表达心事的孟加拉女孩——最真实的模样。
精选文章: