AI 战胜电竞选手后,美国想用玩家脑波训练军事机器人
▼
如同前阵子美军使用无人机对伊朗行使斩首行动,证明现代战争即将进入自动时代,美国在军事技术和思想一直走在世界最前端。
日前,称为网络发源地的美国 DARPA(国防高等研究计划署)开始了关于 AI 在军事决策领域的研究。
用策略游戏培训 AI
从外媒报道,可得知纽约大学水牛城分校人工智慧学院工程师已获得 DARPA 资助。他们透过创造类似《星海争霸》或《恒星战役》(Stellaris)等游戏,并采集玩家的大脑活动和反应,使用这些资料训练 AI 。
▲ DeepMind 决策过程。
与 AlphaGo 下围棋不同,类似《星海争霸》的 RTS 游戏在策略和操作复杂度更高,需要玩家协调采集资源、建造建筑、选择进攻策略,甚至还要操控每个士兵的精细动作,且都是在有“战争迷雾”,也就是不完全资讯的条件下进行。
▲ 水牛城分校研究现场。(Source:水牛城分校)
很显然,此类游戏比简单的棋类策略与真实的战场环境更接近,在这种资讯不对称的环境训练的 AI,更容易在资讯错综复杂的战场上做合理判断。
监测脑波,向 AI 展示人类决策过程
可能有人要问,这和之前 Google 团队针对《星海争霸 II》开发的 DeepMind 有什么区别。与 DeepMind 目的是获胜不同,DARPA 想观察人类在类似场景的判断和决策,并用机器学习演算法整理,训练出能相互协调的机器人。
▲ DeepMind 眼中的游戏。
为了达成目的,DARPA 要求所有在水牛城分校玩新策略游戏的玩家配戴侦测脑波图(EEG)的头盔。观察玩家做决策时,研究者可对照脑波图,观察玩家在策略选择时的大脑活动。
同时研究人员还搭配特殊的超高速镜头关注玩家的眼球运动。配合游戏画面,观察人类在决策时的直觉反应。
为什么 DARPA要做这研究?
对于 DARPA 来说,他们并不想要单单执行工作的机器人,他们需要一群机器人互相配合,根据目前掌握的资讯自己规划、并有策略的完成工作。
如果策略执行时遇到阻碍,也能随机应变。比如高度复杂的环境下(天气、地理环境、敌我动态)多达 250 个单位(空中与地面机器人)协作,这时突然出现烟雾导致可见度低落,AI 控制的机器人同样能改变策略,完成工作。
▲ 未来的无人机蜂群作战。
只有达到这种程度,AI 在军事领域的应用才能派上用场。
但从目前来看,目前 AI 都是在相对确定的环境下训练,但真实环境往往复杂且缺乏资讯。在这种环境下决策,AI 需要根据已知资讯推理,目前 AI 在这方面还处于新生儿状态。
▲ 美军微型无人机“蜂群”展示。(Source:影片截图)
此研究的意义是让人类成为老师,向 AI 展现人类长期演化后的直觉,并透过监测脑波,向 AI 展示人类如何处理接收的资讯,进而让 AI 产生推理能力,并最终学会如何制定总体策略。
▲ 完成工作后“蜂群”绕圈飞行。(Source:影片截图)
我们知道,人类之所以能生存下来,就是因为人类不仅有个体决策,还有指导人类完成工作的总体策略。所以如果想要 AI 完成人类的工作,指导 AI 相互配合并制定总体决策就势在必行。
结语
过去,机器是辅助人类工作的工具,必须由人操控。后来,人类为工具编好执行流程,让工具按照流程自动工作。
现在,机器透过机器学习和神经网络演算法,能执行简单的判断和决策工作。
未来,人类将赋予机器群体策略能力,人类不再需要为每个机器决定工作,我们只需要给一个目标,AI 就会制定整体策略,并分配工作给独立 AI 操控的每台机器,合作完成任务。
从总体来看,这是人类的一大技术进步。只是从历史角度看,这种技术通常先用在军事行动。还是那句老话:技术不分善恶,只在用途。如果这种技术成为现实,希望永远不要用于战争。
(本文由 爱范儿 授权转载;首图来源:水牛城分校)
延伸阅读:
- F/A-18 漫天释出的 103 个微型无人机,将是你的恶梦
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。