年终收藏,吴恩达盘点 2020 年度 AI 热门事件
▼
12 月 24 日吴恩达在圣诞节之际回顾 2020 年 AI 重大发展,包括 AI 对付新冠疫情、训练资料库有种族偏见、对抗假消息演算法、AlphaFold 预测蛋白质 3D 结构、1750 亿参数的 GPT-3 出现等。
吴恩达寄语:
亲爱的朋友们,在过去的 10 年中,每年我都会飞往新加坡或香港,与我的母亲一起庆祝她 12 月 22 日的生日。今年,我们透过 Zoom 线上庆生。尽管距离遥远,我仍然感到很高兴,我的家人可从美国、新加坡、香港和纽西兰一起线上聚会,并演唱同步性很差的〈Happy Birthday To You〉。
我希望我也可以和大家一起用 Zoom 通话,以祝大家节日快乐,新年快乐!
节假日期间,我经常想一想重要的人,回顾他们为我或他人所做的事,并默默表示我对他们的感谢。这使我感到与他们的联系更紧密。
我觉得在远离社交的假期思考这点非常有价值:谁是你生活中最重要的人,你可能出于什么原因感谢他们?
无论面对面还是网络,我都希望你能找到属于自己的方式──在假期里培养与最重要人的关系。Keep learning!
2020 年回顾
凡是过往皆为序章
过去一年,突如其来的传染性冠状病毒破坏了人们的正常生活,导致的社会裂痕也威胁到我们的共同利益。
在这一年,有大量机器学习工程师参与,设计出用于新冠肺炎(Covid-19)诊断和治疗的工具、建立辨识仇恨言论和假讯息的模型,并指出和强调整个 AI 社群有偏见存在。
但也有轻松一面:这一年可将睡衣一键换成西装的在家办公工具、GPT-3 语言模型、AI 辅助艺术和表演等引人入胜的实验。
接下来就一起探讨过去一年的艰辛和辉煌吧。
应付新冠疫情
AI 加快科学家对新冠病毒疫苗的搜寻,全球机器学习研究人员争先恐后利用 AI 技术对抗新冠病毒,例如:
1、巴黎和坎城在公车站、公共汽车和市场使用计算机视觉评估法规的遵守情况。
2、多哥共和国官方训练 AI 模型以辨识卫星图像的贫困地区,并精准分配救济金给最需要的人。
3、聊天机器人提供合成的虚拟朋友,提供因疫情封锁的人们聊天交流。
4、视讯会议公司为线上工作提供 AI 模型,以过滤背景噪音,并将睡衣变成虚拟的商务西装。
5、内地研究机构合作开发可在 CT 扫描检测 Covid-19 的 AI 模型,准确度超过 90%。模型已在 7 国及地区部署,程式码下载量超过 300 万次。
6、美国生物技术公司 Moderna 疫苗于 12 月获得美国食品药品监督管理局批准,使用机器学习优化 mRNA 序列,以转化为可测试的分子。
此外,AI 治疗 Covid-19 的过程也发挥重要作用。例如,某非营利组织使用半监督深度学习平台筛选 14,000 种候选抗病毒药物,验证有望用于动物试验的 4 种化合物。
我的立场:AI 不是万能,但这种新型、高传染性冠状病毒已成为人类利用 AI 对抗传染病能力的有力试验对象。
Deepfake 伪造“一切”
当生成对抗网络渗透到文化、社会和科学领域,就悄悄散布无底洞的合成图像到网络。
如我们所见,Deepfake 出现在主流娱乐活动、商业广告、政Z活动,甚至纪录片,用来替换当事人的真实面貌以提供隐私保护。
起初,图像生成器大肆使用并没有引起人们注意,直到 2019 年,一张“This Person Does Not Exis”的逼真合成人像在网络盛传,具幽默感的工程师受到启发,开始利用生成式对抗网络(GAN)模仿现实世界的细节:
1、经过训练的 Google Earth 可使“This City Does Not Exist”产生大大小小定居点的鸟瞰图。
2、“This Horse Does Not Exist”可以生成各种姿势、品种和形态的马。
3、“This Pizza Does Not Exist”,与真实披萨相比,可能会缺少一些起士和酱汁的光泽感。
4、生成不存在的内地山水画,欺骗众多艺术爱好者。
(Source:Chinese Landscape Painting Creation Using Generative Adversarial Networks)
训练资料库有种族偏见
深度学习的基本资料库开始受到广泛关注。
由于资料库的编译、标记和使用方式不同,导致模型训练过程会对社会边缘化群体产生偏见。研究人员的审查促进 AI 改革,同时也加深人们对 AI 隐含的社会偏见认识。今年典型案例包括:
1、知名计算机视觉资料库 ImageNet 被迫下架。ImageNet 的创建者李飞飞及同事重新整理资料库,并删除 WordNet 词汇资料库的种族主义、性别歧视和其他贬义标签。
2、一项研究发现,即使使用未经标记的 ImageNet 资料库训练,模型也可能由于资料多样性不足引起偏差。
3、麻省理工学院计算机科学与人工智能实验室撤回 Tiny Images 资料库,原因是有外部研究人员发现充斥性暗示、种族歧视等大量不良标签。
4、训练 StyleGAN 的资料库 FlickrFaces-HQ(FFHQ)同样缺乏多样性。基于 StyleGAN 模型训练的 PULSE 演算法,将前美国XX欧巴马的肖像画变成白人(PULSE 将提高低解析度照片转化为高解析度的图像)。
PULSE 事件出现后,Facebook 首席科学家 Yann LeCun 和当时 Google AI 伦理负责人 Timnit Gebru 展开辩论,争论焦点在于:机器学习的社会偏见是出自 AI 资料库,还是 AI 系统本身?
LeCun 的立场是,模型训练“有偏见的资料库”之前没有偏见,也就是模型本身不会有偏见,且有偏见的资料库可以修改。Gebru 则表示,正如信中所说,这种偏见是在社会差异的背景下产生,要消除 AI 系统的偏见,必须解决整个领域的差异。随后关于偏见的进一步分歧,Gebru 和 Google 分道扬镳。
我的立场:确保资料库的偏见在任务开始时就删除,这项重要的工作才刚开始。
对抗假讯息算法
全球新冠疫情和有争议的美国大选掀起假讯息风暴,大型 AI 科技公司均受到影响。
面对大众日益增加的压力:阻止煽动性谎言,Facebook、Google 旗下 YouTube 及 Twitter 都争相更新推荐引擎。据了解,Netflix 严厉痛斥;美国国会议员展开调查;民意测验显示,科技企业失去了大多数美华人的信任。
这几家公司尝试透过各种演算法和策略解决假讯息问题:
1、发现数百个含 AI 生成的假头像个资后,Facebook 严厉打击认为有误导性的操纵媒体,并彻底禁止 Deepfake 影片,并继续开发深度学习工具,以检测仇恨言论,导致偏见的迷因及有关 Covid-19 的错误讯息。
2、YouTube 开发分类器辨识违规内容:包括仇恨言论、阴谋论、医学错误讯息及其他恶意影片。
3、Facebook 和 Twitter 关闭认为是扰乱地区宣传活动的帐户。
4、这 3 家公司在含美国大选误导性讯息内容均添加免责声明。Twitter 采取最严格的政策,直接举报川普的推文是假讯息。
不过,他们显然没有做到触及底线的更改,且改革可能也不会持续很久,因为政策有的已松懈,有的发生了适得其反的效果:
- 6 月《华尔街日报》报道,一些 Facebook 高层停止使用部分监管工具,后来更撤销选举期间使用的修改演算法,因促进某些新闻消息来源的知名度。Facebook 诚意不足的做法导致一些员工辞职。
- YouTube 的演算法成功减少假讯息内容创作者的访问量,但也增加某些经常传播同样可疑讯息的大型媒体访问量,如 Forbes 新闻。
我的立场:目前在这场猫和老鼠的游戏,尚无明确的方法赢过造谣者或假讯息传播者,但猫在这场游戏必须保持领先地位,否则将会失去大众信任,或遭监管机构调查。
AlphaFold 预测蛋白质 3D 结构
AI 在医学方面阻碍减少,为深度学习在医疗设备和治疗的广泛应用奠定基础。
前不久,DeepMind 的 AlphaFold 模型短短几小时就确定蛋白质的 3D 结构,对研发新型药物的承诺和对生物学的洞察迅速引起人们的关注。据了解,医疗机构已采取行动,将此类技术纳入主流医学。
制度转变提高医疗 AI 的知名度,也越来越受到认可:
1、美国最大医疗保险公司同意向某些使用机器学习设备的医生提供补助。
2、美国食品药品监督管理局(FDA)批准几种基于 AI 的治疗方法和设备,如心脏超音波检查系统。
3、一跨学科国际医学专家小组有两个协议:Spirit 和 Consort,旨在确保基于 AI 的临床试验遵循最佳实践,同时便于外部评审人验证试验成果并报告。
我的立场:AI 的医学应用要求医生和医院重新组织工作流程,一定程度上延缓 AI 应用的进度。一旦 FDA 和医疗保障制度更明朗,临床医生就会获得更大动力做出改变以适应。
GPT-3 解锁写作新方式
自然语言处理的神经网络体积越来越大,功能也越来越丰富有趣。如 GPT-3 可写作画图、写代码、玩游戏等,网友玩出 50 多种新用法。
GPT-3 是 OpenAI 打造包含 1,750 亿参数的文本生成器,展示出自然语言处理的持续进步。它展现机器学习领域的广泛趋势:模型参数呈指数增长,无监督学习成为主流,且越来越普遍。
1、GPT-3 的写作能力比上一代 GPT-2 更强大,以至于撰写文章和 Reddit 评论时,成功骗到很多人类。也有很多人以不同方式展现 GPT-3 的创造性,如撰写哲学文章、与历史人物对话。▲AI 生成的哲学文章。
2、语言模型促进商业工具发展,如帮助苹果自动更正功能区分不同语言;让亚马逊的语音小助手 Alexa 跟随对话内容切换;更新机器人律师,对非法自称美国公民的电话销售商提起诉讼。
3、OpenAI 的 GPT-2 训练 Pixel 数据生成 iGPT,iGPT 透过填充部分模糊的内容生成怪异的图像。
我的立场:语言模型显然越大越好,但不止于此。iGPT 预告着图像和文字训练模型,至少 OpenAI 的工作,可能比 2020 年的巨型语言模型更聪明、更怪异。
- The Batch: Biggest AI Stories of 2020: Covid Triage, Fun With GANs, Disinfo Whack-A-Mole, GPT Superstar, ImageNet Recall, FDA Approvals
(本文由 雷锋网 授权转载;首图来源:pixabay)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。