病毒式传播!Deepfake 一键合成成人色X影片,遭各大平台封杀

病毒式传播!Deepfake 一键合成成人色X影片,遭各大平台封杀

Deepfake 负面应用愈演愈烈。10 月,“一键脱衣”AI(DeepNude)盗用社群网络自拍照生成裸T刷爆社群网络,短短几天,致使 68 万女性受害。近日,再次有外媒爆出在 Reddit 社群中,一个名为 r / GeneratedPorn Subreddit 正在散播大量色X作品,而制作这些色X作品的正是造假软件──Deepfake。

这些虚假的色X作品已在 Twitter、Facebook、Reddit 多个社群网络,以及 XVideos、Pornhub 等色X网站上被疯狂传播。

不同于 DeepNude 利用社群网络中的私人照片,这次 Deepfake 造假软件利用的是现有的成人色X作品。创建者认为在原有色X作品上,利用 Deepfake 生成不存在的人脸进行二次创作可以避免法律上的惩罚和道德上的谴责。

但事实可能并非如此,目前 Reddit、XHamster 等多个网站已经将该软件封杀,并强调,

Reddit 网站政策禁止非自愿色X内容的分享和传播,包括 Deepfake 作品。

利用“成人影片”的 Deepfake

Deepfake 的深度造假能力到底有多强?它除了支援换头、换脸、对嘴型以及脱衣外,甚至还可以生成一张完全不存在的人脸,像下图这样,连头发丝都显得逼真自然。

病毒式传播!Deepfake 一键合成成人色X影片,遭各大平台封杀 AI与大数据 图2张

(Source:影片截图)

然而,正是这项原本被广泛用于影视业的逼真造假技术,被一名博士生用来创建了大量淫秽影片。

这款 Deepfake 造假软件被命名为 GeneratedPorn,简称 GP。GP 所利用的色X数据集全部来自于捷克的一家色X片制作公司──Czech Casting。

多年来,该公司拍摄了成千上万的女性影片,并托管在共享网站支援免费下载。影片中每个女性都被编号,并站在白色背景下进行 360 无死角拍摄,甚至包括局部生殖器官的镜头特写。

这些高清、无死角的影片内容非常符合机器学习演算法的训练要求,GP 的创建者从中提取了 7,500 张图像,他说:

之所以选择该数据源是因为,生成对抗网络(GAN)需要学习生成对像类的图像结构,如果图像在结构上相似,则模型可以了解有关对象类的更精确细节,比如精确到脸上的酒窝或雀斑,这样可以获得更高品质的结果。

GAN的全称为 Generative Adversarial Networks ,是一种深度学习模型,是近年来复杂分布上非监督学习最具前景的方法之一。该网络模型分为生成网络和判别网络模型,两个神经网络在相互博弈中,可以获得逼真的图像输出结果。

继 2016 年 GAN 首次被提出之后,NVIDIA 在此基础上研发出了 StleGAN,并在 2019 年升级为 StyleGAN2。如之前所说,StyleGAN2 在生成人脸,尤其是生存逼真且不存在的人脸方面已经达到最高性能,更重要的是,该模型已经在 GitHub 开源。

GP 创建者表示,它利用的就是开源的 StyleGAN2 模型,并用色X数据集加载到其中进行训练。这个过程与其他换脸 Deepfake 相似,但不同的是,GP 使用的不是一张人脸多种表情组成的数据集,而是多个数据集中提取的数据。

同时,他也强调虽然 GP 生成的色X内容非常逼真,肉眼甚至看不出任何破绽,但它生成的是不存在的人脸。

遭多个平台封杀,创建者:我只是想炫耀一下

今年 9 月,这位博士生在 Reddit 上开设论坛,开始炫耀其用 GP 软件生成的色X作品。按照他的说法,在创建 GP 之初,已经曾考虑过道德层面的问题了。最后之所以选择现有色X作品做为训练数据集,部分原因也是出于道德层面的考虑。

这位博士生是一位电脑科学相关的学生,同时也是一位 AI 技术狂热爱好者。他说,

这一切的开始都是出于对技术的好奇和热爱,尤其是转向生成色X作品以后,这是一项非常酷的技术。

一开始,他计划制作一个 OnlyFans,提供定制化的 AI 裸T影片,但是这个想法遭到好友反对,因此,他将目标转向了色X公司的作品集。在他看来,利用成人色X作品,并切换成不存在的人脸图像,创建的色X图像可以避免道德上的谴责。

但事实可能并非如此,尽管是成人作品,但涉及到的女性并未给予授权,因此依然属于非法盗用。此外,其数据集所属公司 Czech Casting 正在面临刑事诉讼。

警方指控该公司透过贩卖人口和性Q来非法获取女性色X图像和影片,并勒令其向 22 名影片中的女性支付近 1,300 万美元的精神赔偿。同时,其创始人也正被联邦调查局(FBI)通缉。

而他对此并非不了解,因此,他解释了两点:

  • 一是要透过演算法生成完整的裸露身体,需要更多真实且裸露的图像和影片,而 Czech Casting 的影片无疑是最佳资源。
  • 二是有些女性是专门从事这项工作的,我无法透过图片判断其背后的故事,因此只能假设这些资源是可以利用的。

此外,虽然一再强调已经尽力在规避道德问题,但他还是在 XVideos、Pornhub、XHamster、Twitter、Facebook 多个网站上开通了个人帐号并分享其色X作品。

目前,多个社交平台已经将其帐号封禁。其中,XHamster 删除 GP 用户资料的同时也表示,

这些类型的内容确实属于灰色地带,我们需要与自己的机器学习团队以及 TOS 团队一起审查,以确定该如何评估和预防。

Deepfake 的正确使用方式为何

除了 GP,DeepNude 创建者也是出于对技术研究的热忱。

但无论是出于什么原因,他们的做法确实滥用 AI 技术产生恶劣的影响。而且如果从技术的角度来讲,他们应该处理好数据隐私问题,包括数据集授权以及社群网络分享。

这一点可以借鉴 Facebook 的做法。

2019 年,Facebook 为应对社群网络中充斥的色X影片造假问题,发起了 Deepfake 挑战赛(Deepfakes Detection Challenge)。

病毒式传播!Deepfake 一键合成成人色X影片,遭各大平台封杀 AI与大数据 图3张

(Source:影片截图)

该挑战赛的所用数据集就包含了 10 万张色X演员的表演影片,供研究人员使用。但重点是,该数据集已付费并获得授权,同时技术测试内容也禁止任何社交平台分享。正如数据科学家乔杜里(Chowdhury)所说:“在未经授权的情况下使用资料库图像的 AI 是不道德的。”

但事实上,除了专业机构外,大部分利用 AI 生成的虚假影片均未获得授权,而且其中色X影片占比最高,达到了 96%。据了解,Facebook 托管在 Kaggle 的色X数据集也曾多次被盗取(Kaggle 是为开发商、数据科学家提供举办机器学习竞赛、托管资料库、编写和分享代码的专业平台)。

正因如此,Deepfake 逐渐沦为一个臭名昭着的造假软件。为遏制虚假内容的生成,Facebook 的努力已经初见成效(辨识准确率可达 82.56%),但想要完全关上潘朵拉的盒子,还需要更多企业、学界以及开发者的共同努力。

  • ‘Frankenstein’s Monster:’ Images of Sexual Abuse Are Fueling Algorithmic Porn
  • This Website Uses AI to Generate the Faces of People Who Don’t Exist
  • We Are Truly Fucked: Everyone Is Making AI-Generated Fake Porn Now

(本文由 雷锋网 授权转载;首图来源:影片截图)

延伸阅读:

  • 一键脱衣 AI 再次惊现!Deepfake 正在盗用你的自拍照,制造大量色X图片
  • 美国登月失败影片流出?原来是 MIT 要世人防范 Deepfake 的造假影片

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。