Google AI 一键生成客制版 3D 神兽,还可线上体验
▼
会画画的 AI 有多可怕?你是否想过把蚂蚁和猪、螃蟹和鲸鱼,或 100 种生物任两个组合起来会是什么样子?现在,AI 可以把这些天马行空的想像全部变成现实。
只需要我们点点鼠标随便涂鸦,像这样:
犀牛的犄角、老鹰的翅膀、恐龙的尾巴,组合起来就变成这样:
一幅完美的专业创意作品,对绘画小白真是太友善。更重要的是,或许还能激发你的创意灵感,这也是 Google 研究团队推出这款工具的目的之一。
这款 AI 绘画神器名为 Chimera Painter,是线上工具,功能是利用动物简图生成逼真的“小怪兽”。
(Source:TechCrunch)
涂鸦完后,只要点击“转换”按钮,就会自动生成 3D 效果的“怪兽”。Google 研究团队还把 Chimera Painter 创作的怪兽做成数位卡牌游戏。
每张卡的攻击值由怪兽决定,而怪兽的技能由组成的两种物种决定。
(Source:Google AI Blog,下同)
据了解,这款 AI 工具的研发灵感来自平时玩游戏都可看到的“怪兽”。Google 研究人员认为,怪兽创作往往需要游戏美术设计有高度艺术创造力和技术知识,而 AI 可充当画笔,帮他们节省创作时间,如一键完成 3D 渲染,甚至还能增强创造力。
假如游戏有 100 种动物,每种动物都能融合,会给艺术家带来很大的工作量,但这对机器学习来说很轻松。
那么这 AI 是如何做到的?
基于 GAN 的生成模型
Chimera Painter 是一种机器学习(ML)模型。为了生成高品质且任意组合的怪兽模组,研究团队提供数千张生物图像,并标记如爪、腿、眼睛等特殊部位,以供模型训练。
训练过程使用的仍是生成对抗网络(GAN),GAN 已讲过很多次,可基于两个卷积神经网络:生成器和判别器生成高清且逼真的新图像。工作原理是生成器创建新图像,判别器确定图像是否来自训练资料库。
不过研究人员提出称为条件 GAN 的变体,生成器采用单独输入指导图像生成过程。有趣的是,这种方法与其他 GAN 的工作完全不同,因后者通常侧重照片真实性,而新工具的目的是融合不同物种成嵌合体。
为了训练 GAN,研究团队创建全彩色图像资料库,包含单种生物轮廓,改编自 3D 生物模型。这种生物轮廓描述每种生物的形状和大小,并提供分割地图辨识身体各部分。
(Source:TechCrunch)
训练后的模型可基于艺术家提供的轮廓,生成表现最好的多物种嵌合体,并嵌入 Chimera Painter。
创建有结构的生物数据集
使用 GAN 生成新物种时会遇到一个问题,即在绘制图像细节或低对比度部分时,可能会失去空间的连贯性,包括眼睛、手指,甚至是具相似纹理的重叠身体部位间的区别。
(Source:Google AI Blog,下同)
因此这对训练资料库提出一定要求,现有图库不适合训练 ML模型,原因是可能有冲突或缺少多样性。生成嵌合体的资料库需要有独特性,如戏剧性视角、构图和灯光等。为了解决这问题,研究人员开发用户主导的半自动方法,即从 3D 生物模型创建 ML 训练资料库。过程中用户将创建并获得一组 3D 生物模型。
具体来说,他们将使用虚幻引擎制作 2 组纹理,并叠加在 3D 模型上——一组有全彩色纹理(左图),另一组显示身体每个部位(如头、耳朵、脖子等),称为分割图(右图)。
图二身体细分部分会提交模型训练,以确保 GAN 了解各种生物身体部位的特定结构、形状、纹理和比例。
3D 生物模型都放在 3D 场景,并同样使用虚幻引擎。一组自动化脚本将采用这个 3D 场景,并在不同的姿势、视点和每个 3D 生物模型的缩放等级间插值,创建全彩色图像和分割地图,形成 GAN 的训练资料库。
研究人员为每个 3D 生物模型生成 10,000 多张图像+分割图,与手动创建这些资料相比,用户每张图像可节省约 20 分钟。
生成高传真度图像
GAN 的超参数大小会影响模型输出图像的品质。为了验证模型哪个版本性能最佳,研究团队收集分析模型生成不同生物类型的样本,并提取一些显着特征,如深度感、生物纹理样式、脸部眼睛的真实感等。
这些讯息不仅用于训练模型新版,且能在模型生出成千上万生物图像后,从每种生物类别(如瞪羚、山猫、大猩猩等)选出最佳图像。
研究团队透过感知损失( Perceptual Loss)最佳化 GAN。损失函数组件使用从单独的卷积神经网络(CNN)提取的特征计算两幅图间的差异,卷积神经网络之前已训练 ImageNet 资料库数百万张照片。
从 CNN 不同层提取特征,并对每个特征施加权重,这会影响特征对最终损耗值的贡献,这些权重对确定最终图像的外观至关重要。
下面是来自不同感知损失权重训练 GANs 的结果。
颜色变化主要由资料库导致,因资料库一个生物往往包含多种纹理(如蝙蝠的红色版和灰色版),即使忽略颜色变化,许多差异也直接与感知损失值变化有关。研究人员发现,特定值会产生更清晰脸部特征,使生成生物更有真实感。
下面是一些由 GAN 生成的生物,使用不同感知损失权重训练,展示模型可处理一小部分输出和姿势。
线上体验
总之,对艺术创作者或绘画爱好者来说,Chimera Painter 只需调整生物局部形状、类型或位置,就可轻松创建大量图像,而不是从头绘制几十种类似的生物。同时模型还允许使用外部软件(如 Photoshop)创建的生物轮廓。
Google 团队表示,希望这些 GAN 模型和 Chimera Painter 工具可激发人们生出新艺术创作思路。
使用机器学习画画时,你想创造出什么东西呢?
- Google has created an AI-powered nightmare creature generator
(本文由 雷锋网 授权转载;首图来源:Chimera Painter)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。