Google AI 一键生成客制版 3D 神兽，还可线上体验

AI与大数据 1小时前 0

▼

会画画的 AI 有多可怕？你是否想过把蚂蚁和猪、螃蟹和鲸鱼，或 100 种生物任两个组合起来会是什么样子？现在，AI 可以把这些天马行空的想像全部变成现实。

只需要我们点点鼠标随便涂鸦，像这样：

（Source：Google AI Blog，下同）

犀牛的犄角、老鹰的翅膀、恐龙的尾巴，组合起来就变成这样：

一幅完美的专业创意作品，对绘画小白真是太友善。更重要的是，或许还能激发你的创意灵感，这也是 Google 研究团队推出这款工具的目的之一。

这款 AI 绘画神器名为 Chimera Painter，是线上工具，功能是利用动物简图生成逼真的“小怪兽”。

（Source：TechCrunch）

涂鸦完后，只要点击“转换”按钮，就会自动生成 3D 效果的“怪兽”。Google 研究团队还把 Chimera Painter 创作的怪兽做成数位卡牌游戏。

每张卡的攻击值由怪兽决定，而怪兽的技能由组成的两种物种决定。

（Source：Google AI Blog，下同）

据了解，这款 AI 工具的研发灵感来自平时玩游戏都可看到的“怪兽”。Google 研究人员认为，怪兽创作往往需要游戏美术设计有高度艺术创造力和技术知识，而 AI 可充当画笔，帮他们节省创作时间，如一键完成 3D 渲染，甚至还能增强创造力。

假如游戏有 100 种动物，每种动物都能融合，会给艺术家带来很大的工作量，但这对机器学习来说很轻松。

那么这 AI 是如何做到的？

基于 GAN 的生成模型

Chimera Painter 是一种机器学习（ML）模型。为了生成高品质且任意组合的怪兽模组，研究团队提供数千张生物图像，并标记如爪、腿、眼睛等特殊部位，以供模型训练。

训练过程使用的仍是生成对抗网络（GAN），GAN 已讲过很多次，可基于两个卷积神经网络：生成器和判别器生成高清且逼真的新图像。工作原理是生成器创建新图像，判别器确定图像是否来自训练资料库。

不过研究人员提出称为条件 GAN 的变体，生成器采用单独输入指导图像生成过程。有趣的是，这种方法与其他 GAN 的工作完全不同，因后者通常侧重照片真实性，而新工具的目的是融合不同物种成嵌合体。

为了训练 GAN，研究团队创建全彩色图像资料库，包含单种生物轮廓，改编自 3D 生物模型。这种生物轮廓描述每种生物的形状和大小，并提供分割地图辨识身体各部分。

（Source：TechCrunch）

训练后的模型可基于艺术家提供的轮廓，生成表现最好的多物种嵌合体，并嵌入 Chimera Painter。

创建有结构的生物数据集

使用 GAN 生成新物种时会遇到一个问题，即在绘制图像细节或低对比度部分时，可能会失去空间的连贯性，包括眼睛、手指，甚至是具相似纹理的重叠身体部位间的区别。

（Source：Google AI Blog，下同）

因此这对训练资料库提出一定要求，现有图库不适合训练 ML模型，原因是可能有冲突或缺少多样性。生成嵌合体的资料库需要有独特性，如戏剧性视角、构图和灯光等。为了解决这问题，研究人员开发用户主导的半自动方法，即从 3D 生物模型创建 ML 训练资料库。过程中用户将创建并获得一组 3D 生物模型。

具体来说，他们将使用虚幻引擎制作 2 组纹理，并叠加在 3D 模型上——一组有全彩色纹理（左图），另一组显示身体每个部位（如头、耳朵、脖子等），称为分割图（右图）。

图二身体细分部分会提交模型训练，以确保 GAN 了解各种生物身体部位的特定结构、形状、纹理和比例。

3D 生物模型都放在 3D 场景，并同样使用虚幻引擎。一组自动化脚本将采用这个 3D 场景，并在不同的姿势、视点和每个 3D 生物模型的缩放等级间插值，创建全彩色图像和分割地图，形成 GAN 的训练资料库。

研究人员为每个 3D 生物模型生成 10,000 多张图像＋分割图，与手动创建这些资料相比，用户每张图像可节省约 20 分钟。

生成高传真度图像

GAN 的超参数大小会影响模型输出图像的品质。为了验证模型哪个版本性能最佳，研究团队收集分析模型生成不同生物类型的样本，并提取一些显着特征，如深度感、生物纹理样式、脸部眼睛的真实感等。

这些讯息不仅用于训练模型新版，且能在模型生出成千上万生物图像后，从每种生物类别（如瞪羚、山猫、大猩猩等）选出最佳图像。

研究团队透过感知损失（ Perceptual Loss）最佳化 GAN。损失函数组件使用从单独的卷积神经网络（CNN）提取的特征计算两幅图间的差异，卷积神经网络之前已训练 ImageNet 资料库数百万张照片。

从 CNN 不同层提取特征，并对每个特征施加权重，这会影响特征对最终损耗值的贡献，这些权重对确定最终图像的外观至关重要。

下面是来自不同感知损失权重训练 GANs 的结果。

颜色变化主要由资料库导致，因资料库一个生物往往包含多种纹理（如蝙蝠的红色版和灰色版），即使忽略颜色变化，许多差异也直接与感知损失值变化有关。研究人员发现，特定值会产生更清晰脸部特征，使生成生物更有真实感。

下面是一些由 GAN 生成的生物，使用不同感知损失权重训练，展示模型可处理一小部分输出和姿势。

线上体验

总之，对艺术创作者或绘画爱好者来说，Chimera Painter 只需调整生物局部形状、类型或位置，就可轻松创建大量图像，而不是从头绘制几十种类似的生物。同时模型还允许使用外部软件（如 Photoshop）创建的生物轮廓。

Google 团队表示，希望这些 GAN 模型和 Chimera Painter 工具可激发人们生出新艺术创作思路。

使用机器学习画画时，你想创造出什么东西呢？

Google has created an AI-powered nightmare creature generator

（本文由雷锋网授权转载；首图来源：Chimera Painter）

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

3D AI AI 绘画 Google

基于 GAN 的生成模型

创建有结构的生物数据集

生成高传真度图像

线上体验

相关文章