Google AI 一键生成客制版 3D 神兽,还可线上体验

Google AI 一键生成客制版 3D 神兽,还可线上体验

会画画的 AI 有多可怕?你是否想过把蚂蚁和猪、螃蟹和鲸鱼,或 100 种生物任两个组合起来会是什么样子?现在,AI 可以把这些天马行空的想像全部变成现实。

只需要我们点点鼠标随便涂鸦,像这样:

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图2张

(Source:Google AI Blog,下同)

犀牛的犄角、老鹰的翅膀、恐龙的尾巴,组合起来就变成这样:

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图3张

一幅完美的专业创意作品,对绘画小白真是太友善。更重要的是,或许还能激发你的创意灵感,这也是 Google 研究团队推出这款工具的目的之一。

这款 AI 绘画神器名为 Chimera Painter,是线上工具,功能是利用动物简图生成逼真的“小怪兽”。

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图4张

(Source:TechCrunch)

涂鸦完后,只要点击“转换”按钮,就会自动生成 3D 效果的“怪兽”。Google 研究团队还把 Chimera Painter 创作的怪兽做成数位卡牌游戏。

每张卡的攻击值由怪兽决定,而怪兽的技能由组成的两种物种决定。

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图5张

(Source:Google AI Blog,下同)

据了解,这款 AI 工具的研发灵感来自平时玩游戏都可看到的“怪兽”。Google 研究人员认为,怪兽创作往往需要游戏美术设计有高度艺术创造力和技术知识,而 AI 可充当画笔,帮他们节省创作时间,如一键完成 3D 渲染,甚至还能增强创造力。

假如游戏有 100 种动物,每种动物都能融合,会给艺术家带来很大的工作量,但这对机器学习来说很轻松。

那么这 AI 是如何做到的?

基于 GAN 的生成模型

Chimera Painter 是一种机器学习(ML)模型。为了生成高品质且任意组合的怪兽模组,研究团队提供数千张生物图像,并标记如爪、腿、眼睛等特殊部位,以供模型训练。

训练过程使用的仍是生成对抗网络(GAN),GAN 已讲过很多次,可基于两个卷积神经网络:生成器和判别器生成高清且逼真的新图像。工作原理是生成器创建新图像,判别器确定图像是否来自训练资料库。

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图6张

不过研究人员提出称为条件 GAN 的变体,生成器采用单独输入指导图像生成过程。有趣的是,这种方法与其他 GAN 的工作完全不同,因后者通常侧重照片真实性,而新工具的目的是融合不同物种成嵌合体。

为了训练 GAN,研究团队创建全彩色图像资料库,包含单种生物轮廓,改编自 3D 生物模型。这种生物轮廓描述每种生物的形状和大小,并提供分割地图辨识身体各部分。

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图7张

(Source:TechCrunch)

训练后的模型可基于艺术家提供的轮廓,生成表现最好的多物种嵌合体,并嵌入 Chimera Painter。

创建有结构的生物数据集

使用 GAN 生成新物种时会遇到一个问题,即在绘制图像细节或低对比度部分时,可能会失去空间的连贯性,包括眼睛、手指,甚至是具相似纹理的重叠身体部位间的区别。

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图8张

(Source:Google AI Blog,下同)

因此这对训练资料库提出一定要求,现有图库不适合训练 ML模型,原因是可能有冲突或缺少多样性。生成嵌合体的资料库需要有独特性,如戏剧性视角、构图和灯光等。为了解决这问题,研究人员开发用户主导的半自动方法,即从 3D 生物模型创建 ML 训练资料库。过程中用户将创建并获得一组 3D 生物模型。

具体来说,他们将使用虚幻引擎制作 2 组纹理,并叠加在 3D 模型上——一组有全彩色纹理(左图),另一组显示身体每个部位(如头、耳朵、脖子等),称为分割图(右图)。

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图9张

图二身体细分部分会提交模型训练,以确保 GAN 了解各种生物身体部位的特定结构、形状、纹理和比例。

3D 生物模型都放在 3D 场景,并同样使用虚幻引擎。一组自动化脚本将采用这个 3D 场景,并在不同的姿势、视点和每个 3D 生物模型的缩放等级间插值,创建全彩色图像和分割地图,形成 GAN 的训练资料库。

研究人员为每个 3D 生物模型生成 10,000 多张图像+分割图,与手动创建这些资料相比,用户每张图像可节省约 20 分钟。

生成高传真度图像

GAN 的超参数大小会影响模型输出图像的品质。为了验证模型哪个版本性能最佳,研究团队收集分析模型生成不同生物类型的样本,并提取一些显着特征,如深度感、生物纹理样式、脸部眼睛的真实感等。

这些讯息不仅用于训练模型新版,且能在模型生出成千上万生物图像后,从每种生物类别(如瞪羚、山猫、大猩猩等)选出最佳图像。

研究团队透过感知损失( Perceptual Loss)最佳化 GAN。损失函数组件使用从单独的卷积神经网络(CNN)提取的特征计算两幅图间的差异,卷积神经网络之前已训练 ImageNet 资料库数百万张照片。

从 CNN 不同层提取特征,并对每个特征施加权重,这会影响特征对最终损耗值的贡献,这些权重对确定最终图像的外观至关重要。

下面是来自不同感知损失权重训练 GANs 的结果。

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图10张

颜色变化主要由资料库导致,因资料库一个生物往往包含多种纹理(如蝙蝠的红色版和灰色版),即使忽略颜色变化,许多差异也直接与感知损失值变化有关。研究人员发现,特定值会产生更清晰脸部特征,使生成生物更有真实感。

下面是一些由 GAN 生成的生物,使用不同感知损失权重训练,展示模型可处理一小部分输出和姿势。

Google AI 一键生成客制版 3D 神兽,还可线上体验 AI与大数据 图11张

线上体验

总之,对艺术创作者或绘画爱好者来说,Chimera Painter 只需调整生物局部形状、类型或位置,就可轻松创建大量图像,而不是从头绘制几十种类似的生物。同时模型还允许使用外部软件(如 Photoshop)创建的生物轮廓。

Google 团队表示,希望这些 GAN 模型和 Chimera Painter 工具可激发人们生出新艺术创作思路。

使用机器学习画画时,你想创造出什么东西呢?

  • Google has created an AI-powered nightmare creature generator

(本文由 雷锋网 授权转载;首图来源:Chimera Painter)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。