AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人

AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人

如同前阵子美军使用无人机对伊朗行使斩首行动,证明现代战争即将进入自动时代,美国在军事技术和思想一直走在世界最前端。

日前,称为网络发源地的美国 DARPA(国防高等研究计划署)开始了关于 AI 在军事决策领域的研究。

用策略游戏培训 AI

从外媒报道,可得知纽约大学水牛城分校人工智慧学院工程师已获得 DARPA 资助。他们透过创造类似《星海争霸》或《恒星战役》(Stellaris)等游戏,并采集玩家的大脑活动和反应,使用这些资料训练 AI

AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人 AI与大数据 图2张

DeepMind 决策过程。

与 AlphaGo 下围棋不同,类似《星海争霸》的 RTS 游戏在策略和操作复杂度更高,需要玩家协调采集资源、建造建筑、选择进攻策略,甚至还要操控每个士兵的精细动作,且都是在有“战争迷雾”,也就是不完全资讯的条件下进行。

AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人 AI与大数据 图3张

▲ 水牛城分校研究现场。(Source:水牛城分校)

很显然,此类游戏比简单的棋类策略与真实的战场环境更接近,在这种资讯不对称的环境训练的 AI,更容易在资讯错综复杂的战场上做合理判断。

监测脑波,向 AI 展示人类决策过程

可能有人要问,这和之前 Google 团队针对《星海争霸 II》开发的 DeepMind 有什么区别。与 DeepMind 目的是获胜不同,DARPA 想观察人类在类似场景的判断和决策,并用机器学习演算法整理,训练出能相互协调的机器人

AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人 AI与大数据 图4张

DeepMind 眼中的游戏。

为了达成目的,DARPA 要求所有在水牛城分校玩新策略游戏的玩家配戴侦测脑波图(EEG)的头盔。观察玩家做决策时,研究者可对照脑波图,观察玩家在策略选择时的大脑活动。

同时研究人员还搭配特殊的超高速镜头关注玩家的眼球运动。配合游戏画面,观察人类在决策时的直觉反应。

为什么 DARPA要做这研究?

对于 DARPA 来说,他们并不想要单单执行工作的机器人,他们需要一群机器人互相配合,根据目前掌握的资讯自己规划、并有策略的完成工作。

如果策略执行时遇到阻碍,也能随机应变。比如高度复杂的环境下(天气、地理环境、敌我动态)多达 250 个单位(空中与地面机器人)协作,这时突然出现烟雾导致可见度低落,AI 控制的机器人同样能改变策略,完成工作。

AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人 AI与大数据 图5张

▲ 未来的无人机蜂群作战。

只有达到这种程度,AI 在军事领域的应用才能派上用场。

但从目前来看,目前 AI 都是在相对确定的环境下训练,但真实环境往往复杂且缺乏资讯。在这种环境下决策,AI 需要根据已知资讯推理,目前 AI 在这方面还处于新生儿状态。

AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人 AI与大数据 图6张

▲ 美军微型无人机“蜂群”展示。(Source:影片截图)

此研究的意义是让人类成为老师,向 AI 展现人类长期演化后的直觉,并透过监测脑波,向 AI 展示人类如何处理接收的资讯,进而让 AI 产生推理能力,并最终学会如何制定总体策略。

AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人 AI与大数据 图7张

▲ 完成工作后“蜂群”绕圈飞行。(Source:影片截图)

我们知道,人类之所以能生存下来,就是因为人类不仅有个体决策,还有指导人类完成工作的总体策略。所以如果想要 AI 完成人类的工作,指导 AI 相互配合并制定总体决策就势在必行。

结语

过去,机器是辅助人类工作的工具,必须由人操控。后来,人类为工具编好执行流程,让工具按照流程自动工作。

现在,机器透过机器学习和神经网络演算法,能执行简单的判断和决策工作。

未来,人类将赋予机器群体策略能力,人类不再需要为每个机器决定工作,我们只需要给一个目标,AI 就会制定整体策略,并分配工作给独立 AI 操控的每台机器,合作完成任务。

从总体来看,这是人类的一大技术进步。只是从历史角度看,这种技术通常先用在军事行动。还是那句老话:技术不分善恶,只在用途。如果这种技术成为现实,希望永远不要用于战争。

(本文由 爱范儿 授权转载;首图来源:水牛城分校)

延伸阅读:

  • F/A-18 漫天释出的 103 个微型无人机,将是你的恶梦

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。