与假影片誓不两立!Google AI 开源 Deepfake 检测数据集,3 千多位真人亲自上阵

与假影片誓不两立!Google AI 开源 Deepfake 检测数据集,3 千多位真人亲自上阵

在不久前,Facebook 发起了 Deepfakes 检测挑战赛;而近日,Google AI 就跟着强势推出 Deepfake 影片检测资料库,势将一同与虚假影片誓不两立。

资料库共含 28 个不同场景下,由真人演员现场拍摄的 3 千多段影片。Google 希望透过这些影片,维护整个社会的网络安全环境,并使开发者利用这些数据,开发新的 Deepfake 检测工具,更有效率辨识 Deepfake 假影片。Google 也在部落格发表文章介绍资料库。与假影片誓不两立!Google AI 开源 Deepfake 检测数据集,3 千多位真人亲自上阵 AI与大数据 图2张

(Source:Google AI Blog,下同)

Deepfake 影片检测数据集背景

近几年来,深度学习的发展催生曾认为不可能实现的技术。现代生成模型就是例子之一,能合成超现实主义的图像、语音、音乐甚至影片。这些模型广泛用于各种各样应用,像是透过文本到语音的方式使世界各地区的人更容易沟通,或是生成医学成像的训练数据等。

与任何变革性技术一样,这些技术也带来新挑战。所谓“Deepfake”就是其中之一,可由操纵影片和音频剪辑的深度生成模型制作而得。自从 2017 年底首次出现,就有许多开源的 Deepfake 生成方法流入市面,导致合成媒体剪辑影片的数量不断增加。虽然许多人可能只是出于趣味性目的,但一旦落入不法分子手里,就可能对个人和社会造成极大的危害。

Google 认真考虑了这些问题。正如去年的《人工智慧原则》表示:“我们致力于开发 AI 的最佳实践,以减少技术的滥用带来的潜在危害。”

2018 年 1 月,Google 宣布发表合成语音资料库,以支持开发高性能合成音频检测器的国际挑战赛。挑战赛的一部分,是资料库只供给共计超过 150 个研究机构和工业组织下载;从此刻起,资料库免费对大众开放。

Deepfake 影片检测数据集介绍

Google 与 Jigsaw 合作,并发表自制的大型可视化资料库,纳入 Face Forensics 影片基准测试。基准测试是德国慕尼黑工业大学和义大利拿坡里费德里克二世大学开发的图像测试。将这些数据纳入 Face Forensics 影片基准的是由包括 Matthias Niessner 教授、Luisa Verdriva 教授和 Face Forensics 团队在内的主要研究人员合作开发。

为了制作资料库,过去一年,Google 与众多演员合作录制数百段影片;并使用公开的 Deepfake 生成方法,从这些影片创建数千个 Deepfake 假影片。

这些由真实影片和假影片组成的资料库组成可用于 Deepfake 检测和辨识的素材。Face Forensics 基准测试的一部分,资料库现免费提供给研究社群,研究者可用来开发合成影片检测的方法。与假影片誓不两立!Google AI 开源 Deepfake 检测数据集,3 千多位真人亲自上阵 AI与大数据 图3张

▲ 演员在各种场景拍摄的影片。上为真实影片,下为 Deepfake 影片,两者之间可能有或微妙或剧烈的变化。

Face Forensics++ 与 Deepfake 检测数据集

Face Forensics++ 是由 1,000 支原始影片序列组成的检测资料库,这些影片序列透过 4 种自动脸部操作方法操作,即 Deepfakes、face 2 face、faceswap 和 Neural Textures。这些数据源于 977 支 YouTube 影片,所有影片都包含一张没有遮挡的正面人像,这使自动篡改法能使伪造更真实。

由于此方法提供二进制遮罩,因此这资料库可用于图像和影片分类及分割。此外,Face Forensics++ 还提供 1,000 个 Deepfakes 模型生成和扩充新数据。有关更多资讯可参考网站。

新版本改进内容

  • Deepfake 检测数据集──加入 Google 与 Jigsaw 发表的 Deepfake 检测数据集。
  • Neural Textures──加入使用 GANs 和 Neural Textures 进行脸部作业的方法。

Deepfake 数据集的意义

随着 Deepfake 技术不断发展,Google 将添加更多内容到资料库,并继续与合作伙伴合作。支援蓬勃发展的 AI 研究社群,Google 也希望减轻合成媒体滥用的潜在危害,这也正是在 Face Forensics 基准测试加入 Deepfake 资料库的重要意义。

  • Contributing Data to Deepfake Detection Research
  • FaceForensics++: Learning to Detect Manipulated Facial Images

(本文由 雷锋网 授权转载;首图来源:pixabay)

延伸阅读:

  • Facebook 联手学界征求好手,举行 Deepfake Challenge 提升打击造假影片能力
  • AI 语音模仿老板声音要求转帐,成功骗走近 770 万元
  • 科学家想用老鼠判别 Deepfake 制作的影片,但这事没那么容易
  • 担心被 AI 换脸技术祸害?Deepfake 纠察队正在赶来
  • AI 不只能脸部合成造假,现在全身动作模拟都难不倒它

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。