你上传的 Instagram 照片,正免费帮 Facebook 训练 AI 模型?
▼
训练机器学习辨识图片中的物件,往往需要耗费人力、时间标注出名称、类别,才能让机器顺利训练。为打造出方便厉害的 AI 机器学习模型,Facebook 有一项超级秘密武器──35 亿张 Instagram 公开照片,以及无数 Hashtag。
Instagram 公开照片,成免费训练模型素材
如果你习惯在发文时替照片加上几个 Hashtag,那么你有可能在帮 Facebook 训练机器学习模型。
过去要训练机器学习辨识物件,必须耗费相当多人力,举例来说,如果希望电脑理解“马克杯”这个东西,人类必须先标出这个东西是“马克杯”,接着机器才能有依据学习,现在 Facebook 找到一个用少量人力就能训练机器学习的方法。
第二天开发者大会 F8,首席技术长迈克‧施罗普佛(Mike Schroepfer)表示,Facebook 研究人员与工程师,利用平台 35 亿张公开照片、超过 17,000 个 Hashtag 为基础,透过上百个 GPU 解析资料,来训练自家图片辨识模型,目前在 ImageNet(图像数据库)已可达 85.4% 准确度。
但过程中也面对不少挑战,施罗普佛谈到,许多用户常常用错标签,像是用户虽然在照片标记“花枝”,但其实是“鱿鱼”。另外,Facebook 也必须训练哪些 Hashtag 是同义词,并将具体描述的 Hashtag,排序优于其他同类型 Hashtag,最终变成一套“大规模 Hashtag 预测模组”,来训练图像辨识模组。
▲ Facebook 利用 Instagram 35 亿张公开照片,加上用户标注的 Hashtag,来训练机器学习模型。(Source:Facebook)
Hashtag 训练模型,会有隐私问题吗?
不过现阶段大家更关心的还是“隐私”问题,当用户发表一张 Instagram 照片时,可以清楚知道自己正在提供资料,训练深度学习模型吗?
Facebook 表示,图像资料只会用来辨别与 Hashtag 之间的关联性,使用的资料都是公开的,且就算照片本身没有标签,就算机器再怎么厉害,也无法辨识出照片中的物件。简单来说,在 Instagram 上传公开照片,不论用户是否愿意,都正为 Facebook 的深度学习技术做出贡献。
▲ 首席技术长施罗普佛表示,过程中也面临不少挑战,像是许多用户常常用错标签。(Source:Facebook)
但 Hashtag 仍是训练关键,如果用户不想自己的照片变成训练机器学习的素材,就不要在公开贴文加上 Hashtag。Facebook 强调,团队只会在公开的 Hashtag,撷取与图像有关的素材,不会从照片内容推断用户行为。
Facebook 建构训练机器模型的方法,比起辨识精准度本身更有趣,将庞大、杂乱的素材整理成整齐、有依据的资料,未来可以帮助用户更精准快速的搜寻资料,甚至用 AI 自动生成图片说明、协助审核平台内容。
- Facebook is using your Instagram photos to train its image recognition AI
- Facebook trained image recognition AI with billions of Instagram pics
- Facebook is using billions of Instagram images to train artificial intelligence algorithms
(本文由 AI资源网 授权转载;首图来源:pixabay)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。