你上传的 Instagram 照片，正免费帮 Facebook 训练 AI 模型？

▼

训练机器学习辨识图片中的物件，往往需要耗费人力、时间标注出名称、类别，才能让机器顺利训练。为打造出方便厉害的 AI 机器学习模型，Facebook 有一项超级秘密武器──35 亿张 Instagram 公开照片，以及无数 Hashtag。

Instagram 公开照片，成免费训练模型素材

如果你习惯在发文时替照片加上几个 Hashtag，那么你有可能在帮 Facebook 训练机器学习模型。

过去要训练机器学习辨识物件，必须耗费相当多人力，举例来说，如果希望电脑理解“马克杯”这个东西，人类必须先标出这个东西是“马克杯”，接着机器才能有依据学习，现在 Facebook 找到一个用少量人力就能训练机器学习的方法。

第二天开发者大会 F8，首席技术长迈克‧施罗普佛（Mike Schroepfer）表示，Facebook 研究人员与工程师，利用平台 35 亿张公开照片、超过 17,000 个 Hashtag 为基础，透过上百个 GPU 解析资料，来训练自家图片辨识模型，目前在 ImageNet（图像数据库）已可达 85.4% 准确度。

但过程中也面对不少挑战，施罗普佛谈到，许多用户常常用错标签，像是用户虽然在照片标记“花枝”，但其实是“鱿鱼”。另外，Facebook 也必须训练哪些 Hashtag 是同义词，并将具体描述的 Hashtag，排序优于其他同类型 Hashtag，最终变成一套“大规模 Hashtag 预测模组”，来训练图像辨识模组。

▲ Facebook 利用 Instagram 35 亿张公开照片，加上用户标注的 Hashtag，来训练机器学习模型。（Source：Facebook）

Hashtag 训练模型，会有隐私问题吗？

不过现阶段大家更关心的还是“隐私”问题，当用户发表一张 Instagram 照片时，可以清楚知道自己正在提供资料，训练深度学习模型吗？

Facebook 表示，图像资料只会用来辨别与 Hashtag 之间的关联性，使用的资料都是公开的，且就算照片本身没有标签，就算机器再怎么厉害，也无法辨识出照片中的物件。简单来说，在 Instagram 上传公开照片，不论用户是否愿意，都正为 Facebook 的深度学习技术做出贡献。

▲ 首席技术长施罗普佛表示，过程中也面临不少挑战，像是许多用户常常用错标签。（Source：Facebook）

但 Hashtag 仍是训练关键，如果用户不想自己的照片变成训练机器学习的素材，就不要在公开贴文加上 Hashtag。Facebook 强调，团队只会在公开的 Hashtag，撷取与图像有关的素材，不会从照片内容推断用户行为。

Facebook 建构训练机器模型的方法，比起辨识精准度本身更有趣，将庞大、杂乱的素材整理成整齐、有依据的资料，未来可以帮助用户更精准快速的搜寻资料，甚至用 AI 自动生成图片说明、协助审核平台内容。

Facebook is using your Instagram photos to train its image recognition AI
Facebook trained image recognition AI with billions of Instagram pics
Facebook is using billions of Instagram images to train artificial intelligence algorithms

（本文由 AI资源网授权转载；首图来源：pixabay）

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

AI Facebook 免费顺利

Instagram 公开照片，成免费训练模型素材

Hashtag 训练模型，会有隐私问题吗？

相关文章