当 AI 学会闻气味,人类就可以少工作 70 年

当 AI 学会闻气味,人类就可以少工作 70 年

不知道有多少人还记得 Google Nose。

这个Google在2013年愚人节上线的搞怪计划,声称有一个包含1,500万种味道的气味资料库,用户只需要在Google搜寻框输入关键词,点击“闻一闻”,就能直接在电脑旁闻到该物体的味道,例如新车的味道、篝火的味道以及埃及古墓的味道(?)等。

当 AI 学会闻气味,人类就可以少工作 70 年 AI与大数据 图2张

(Source:Google

就是这个十年前离谱但脑洞大开的玩笑,正被它的发明者部分变成现实。

今年9月初的《科学》杂志刊登了一篇由新创公司Osmo(从Google分拆)和莫奈尔化学感官中心(Monell Chemical Senses Center)等多个研究团队共同发布的论文,其中称, AI模型可以让机器拥有比人类更好的“嗅觉”

乍听之下这简直太不可思议了,毕竟对大众来说,嗅觉是比视觉和听觉抽象得多的存在。RGB颜色图谱可以描述人眼看到的色彩,人耳听到的声音也可以转化为不同频率的波长,甚至让人感受到震动,但唯独嗅觉,看不见摸不着,更难以用量化的指标描述。

换句话说,把气味数位化听起来就是件不可能的事。

而这篇论文的研究人员核心要做的,正是去试图创造一个能够如实反映气味特征的人类嗅觉高维图谱,即POM(Principle Odor Map)。

具体是怎么做的呢?

气味是人类嗅觉系统对散布于空气中的某些特定分子的感应。气味分子进入鼻孔后,会与鼻腔上方的嗅觉细胞产生(受体)反应,产生的生物电波再经由神经传到大脑,进而辨识味道。

而气味的构成实际上要比色彩、声音复杂得多,有数以百万计的不同种类,每种气味又都由数百个化学分子组成,其性质各不相同。与之相应地,人类的功能性嗅觉受体大约有400个,远远超过我们用于视觉的4个,以及用于味觉的约40个。

所以面对如此复杂的嗅觉机制,研究人员首先做的事情就是创建了一个机器学习模型──讯息传递神经网络(MPNN)。

当 AI 学会闻气味,人类就可以少工作 70 年 AI与大数据 图3张

▲ 模型示意图。

这是一种特定的图神经网络(GNN),因为图神经网络是一种基于图结构的深度学习方法,将传统的图分析引入,提供了对非规则资料提取特征的方法,因而也非常适合用来学习复杂的气味特征。

模型搭好之后,接下来就要喂它学习材料。

研究人员结合Good Scents and Leffingwell & Associates(GS-LF)香精香料资料库,建立了一个包含约5,000个分子的参考资料集做为训练基础素材,每个分子可以有多个气味标签,例如果味、花香、起司味和薄荷味等。

当 AI 学会闻气味,人类就可以少工作 70 年 AI与大数据 图4张

▲ GS-LF资料库中的部分分子。

透过将分子的形状结构做为数据输入,模型得以输出最能描述某种气味的对应气味词。

为了让训练结果更准确,研究者也同样使用各种方法来优化模型参数。例如将GS-LF香精香料资料库依照8:2的比例分成训练集和测试集,训练集被进一步划分为五个交叉验证的子集;以及使用贝叶斯优化演算法对资料进行交叉验证,并对GNN模型的超参数进行最佳化等。

实验最终将形成如下的嗅觉高维图谱POM(局部):

当 AI 学会闻气味,人类就可以少工作 70 年 AI与大数据 图5张

这张图直观表示了每种气味的感知距离,例如花香(floral)、肉味(meaty)和酒香(ethereal)几个大类彼此间是存在较大感知距离的;但每个大类下包括更具体的气味,例如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距离则较为接近。

论文将POM和先前有研究先例的基于摩根指纹的气味空间图(Morgan fingerprint-based maps)进行了对比,发现后者尚无法体现上述感知距离:

当 AI 学会闻气味,人类就可以少工作 70 年 AI与大数据 图6张

为了进一步验证模型训练效果,研究者接着找来15位气味专家,来和模型比拼谁辨识气味更准确。

15位专家每人需要闻400种气味,研究者会给出55个气味形容词,让他们就每种气味对这55个选项用1-5分来评分,评定每个气味形容词在多大程度上适合于这个气味。

结果发现,对于其中53%的测试分子,模型的表现都优于小组成员的平均值。

研究者也将模型的预测结果按气味描述词进行了分类,发现除麝香外,模型对分子气味的预测结果均在人类组的误差分布中,且在30个气味描述词的预测结果中优于人类组中位数:

当 AI 学会闻气味,人类就可以少工作 70 年 AI与大数据 图7张

后续,研究者也对模型的性能进行了反复验证,获得了较稳定的分子结构─气味关系。

下面就进入到最激动人心的气味图谱大规模绘制环节,并最终得到下面这张图:

当 AI 学会闻气味,人类就可以少工作 70 年 AI与大数据 图8张

你可以把上文那个表示气味感知距离的座标图理解成是这张图的无限放大版。论文提到,这张图中包含了约50万种气味分子,当中甚至有许多还没有被发现或合成出来(但确实能计算出来)。

做个更直观的比较,如果让训练有素的人类评价员寻找这些气味,大概需要连续工作70年才可以全部收集到。

看起来,这篇论文着实完成了一件大事。

这时就有网友发问了,机器为什么要闻味道?

其他人纷纷提出自己的见解,例如认为可以用于工厂污水处理的品质控制,进行爆炸物、毒品或是尸体的嗅闻等;有人希望可以据此研发出一款好的除臭剂,因为人们在进行大量有氧运动例如跑步或举重后会散发出不好的气味;也有人对这项研究成果在医疗方面的应用很感兴趣,例如可以用来开发嗅觉丧失症的新疗法,或是透过气味检测疾病等;还有香水产业的从业人员觉得这帮了自己大忙,“让它告诉我的同事什么时候他们喷了太多古龙水”。

这些预测事实上都无道理。首先机器确实可以帮助人类解决有时对气味辨别不准确的问题──研究表明,每个人对气味的感知程度都各不相同,会根据感觉和生理信号引发不同反应,其中也受到经验、期望、个性或情境因素的影响。

而气味某些时候对人来说又十分重要。

不好的气味就不用说了,某些有害气体还可能会危害健康,这时如果可以有机器代替某些特定职业帮助人类或动物作业就再好不过。

而对另一些气味可以为之带来好处的职业,例如调香师、厨师、设计师、艺术家和建筑师等,也有调配出更具功能性的气味的需要。有些场合会将气味应用在环境中,例如纽约Sloan-Kettering癌症中心会在空气中散布香草油,以降低患者对于磁振造影(MRI)测试的幽闭恐惧症;芝加哥期货交易所也会散布特定的香味以降低交易大厅的噪音分贝。

也有研究表明,人类大多数与气味有关的记忆都来自婴儿及幼儿时期的最初十年,而语言和视觉所产生的记忆通常在10-30岁之间产生。这部分解释了气味可以唤起人类遥远的回忆,而且透过气味所引起的回忆,经常比视觉或听觉所引起的回忆,更有情绪倾向。

所以气味和人类的连结还是非常紧密的,只是我们很多时候都不容易察觉。

网友们的猜想也在论文的作者之一、来自Osmo公司的Alex Wiltschko那里得到了验证。他在发布在Osmo官网的一篇文章中写道,

“气味图谱是我们实现更远大目标的基础。如果可以开发出能够复制我们鼻子或狗鼻子的功能系统,我们就可以尽早发现疾病;人工智慧也将帮助医生找到更有可能在临床上取得成功的药物,更好地帮助合成化学家和调香师进行工作……我们未来的工作目标是,为改善人类健康和幸福奠定坚实的科学和商业基础。”

不过他也表示,论文依然存在许多不足。

例如,无法体现分子气味的浓淡,只能预测它闻起来是什么样子;只对单一分子气味进行预测,现实生活中更多却是混合气味;而即便是所有的能力都达到了,对气味的复制和还原也将是很大的挑战等。

最后,说了这么多,有一个网友的评论倒是很朴实,“我觉得这会让品酒失去乐趣”。

(本文由 品玩 授权转载;首图来源:shutterstock)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。