卡内基梅隆大学的研究人员近日开发出一款AI模型,能够根据文字描述自动生成乐高结构设计方案。
卡内基梅隆大学(CMU)的研究团队为乐高迷们解答了一个存在数十年的疑问:如果任何创意都能瞬间变成乐高套装会怎样?
在上周发表的论文《通过文本生成物理稳定且可搭建的乐高设计》中,六位作者共同展示了名为"LegoGPT"的创新成果。这款生成式AI模型能够接收如"沙漏形原声吉他"等文字描述,自动确定所需乐高零件清单及组装方案。
目前LegoGPT的演示版和代码已通过研究项目页面公开,意味着乐高爱好者可自由体验。虽然当前输出仅限于约20个类别(包括椅子、吉他、船只、火车和汽车等基础物品),但研究团队正在扩展模型处理复杂品类的能力。
研究者认为,这类工具未来或将成为建筑与产品设计领域多项实际任务的基础平台。
[图片来源:CMU]
LegoGPT如何预测下一块积木
LegoGPT是基于Meta公司LLaMA-3.2-Instruct-1B语言学习模型微调而成,可视为开源版ChatGPT。研究人员通过包含47,000个乐高结构和28,000种独特3D形状的数据库训练模型,每个样本均配有文字说明。依托这些设计数据,LegoGPT仅凭文字提示就能预测如何搭建虚拟物体。
该模型采用生成式AI平台常用的自回归模型架构。
ChatGPT和Llama都属于自回归模型,它们根据已输出的词语序列预测下一个词,"论文合著者、CMU博士生Ava Pun解释道,"比如当系统输出'今天天气'后,它会预测后续可能是'晴'或'雨'。而LegoGPT预测的不是词语,而是下一块积木。"
当LegoGPT生成3D模型后,还需确保结构实际稳定性。Pun表示这颇具挑战性,因为现有模拟器无法理解乐高积木的物理特性。为此团队专门开发了物理验证算法。
"我们定制了考虑所有物理力的算法:重力带来的向下作用力、摩擦力,以及相邻积木间的接触力,"Pun介绍道,"该算法构建结构受力模型后进行全面评估。若合力为零,则表明结构能保持稳定。"
LegoGPT会自动调用该算法验证方案可行性。若某块积木导致模型失衡,系统将持续迭代直至通过稳定性测试。
现实世界的未来应用
目前研究人员已用LegoGPT创建了复古汽车、蒸汽船和电吉他等结构。虽然当前模型仅支持20x20x20体素网格,但团队计划扩充积木类型数据库并提升网格分辨率。
想体验的乐高爱好者可通过公开演示平台将简单描述转化为可搭建的3D模型及零件清单。由于LegoGPT并非面向普通玩家设计,暂不提供分步搭建指南,用户需自行摸索组装顺序。
Pun表示选择乐高作为AI 3D构建能力的测试载体,正是看中其普及性。但团队相信该技术未来可应用于建筑草图生成、定制家具设计等现实场景。
"现有生成式AI只能创造图像或视频概念,却不懂实体制造,"Pun强调,"我们希望通过整合物理定律与组装约束,让生成模型创造出真正可实现的物体。"
精选文章: