继《Dota 2》和《星海争霸》后,人类又一款竞技游戏败给 AI
▼
很多竞技射击游戏中,都能看到名为“夺旗”玩法。这源于西方传统运动,玩家分成两支队伍,目标是把对方基地的旗帜带回自己基地,同时要保护自己旗子不被抢走。
规则看似简单,可比起强调击杀得分的玩法,夺旗对团队配合和战术执行会要求更高,这往往需要几名玩家在进攻和防守间取得平衡点。
但这依旧没有难倒开发 AlphaGo 的 DeepMind 实验室。据 Arstechnica 报道,5 月 30 日《Science》期刊有一篇新论文,称新设计的 AI 程式已能在《雷神之锤 III 竞技场》展现和人类一样的行动模式,还能在夺旗游戏战胜人类队伍。
这也是继《星海争霸 II》和《Dota 2》后,DeepMind 又攻破的复杂竞技游戏。
想让 AI 玩好竞技射击类游戏,难点是什么?
《AlphaGo》影片中,DeepMind 创始人 Demis Hassabis 曾简单说明让 AI 理解围棋玩法的难点。
他说,相比西洋棋,围棋每颗棋子都有更多可走的路径,最终整个棋局变化数目,比全宇宙的原子总数还多。
DeepMind 实验室的挑战,就在于发明效仿人类直觉的进阶演算法,最终让它们像人类一样决策,展开行动。
换成第一人称射击游戏的夺旗,AI 需要有更快的即时决策能力,比如思考什么时间点做什么事才正确?如果两队的比数差较大,又该如何协调队友,采取什么策略才能扳回分数?
为了解决这个问题,DeepMind 实验室建立一套新的双层学习系统。
在内层,DeepMind 会让 AI 专注竞技比赛的核心目标,也就是赢得胜利,基于这点,AI 会再为整个游戏建立数个次级目标,寻求取胜的最短路径,比如跟随队友,或在敌人基地附近游走。
这有一些具象化的东西,比如训练过程中,DeepMind 团队采取“优胜劣汰”,让 AI 淘汰每一轮模拟赛表现最差的方案,然后再把最优秀方案的突出部分取出来,反复改进决策树。
外层部分,根据内层的决策情况来调整其他模组。比如说当内层认为防守战术是现在最好的选择,外层就会提升 AI 对四周环境的视觉感知能力,这样当敌人靠近基地时,AI 便能更快射杀。
这么看下来,DeepMind 开发的这套 AI 还是和人类很相似,内层就像人类“大脑”,主要负责战术策略;外层可当作人类的“眼睛和双手”,负责执行。
确定模型后,接下来就是一遍又一遍训练了。这次 DeepMind 团队投入约 3 周时间,让 AI 进行 45 万局游戏,相当于人类玩家花 4 年积累的时数,效率惊人。
进行到约 10 万场训练时,AI 队伍已达普通人类玩家的水准;20 万局训练后,AI 队伍已能击败职业玩家,且优势逐渐扩大。
另外,研究人员还在训练期间发现一些其他惊喜。比如 AI 会从神经网络分出一部分神经元,专门用于确认队友是否拿到旗子。
团队还使用随机生成的地图场景,为的就是不让 AI 靠地图取胜。
AI 之所以强,不仅因为战术,还有神操作
AI 游戏玩赢人类,靠的是什么?DeepMind 曾表示,这是基于强化学习演算法下的战术执行。
但也有不少人认为,AI 在竞技游戏的真正优势是超高手速和操作效率,且很多是人类玩家无法做到的。
原因很简单,我们玩电脑游戏时需要用到鼠标、键盘和摇杆,人类每次操作,都得先让大脑意识回馈到手指,然后再传到游戏。
但人类选手面对的 AI 并不是机器人,它们没有实体,所以下达指令时并不需要借助摇杆等工具,这等于砍掉了中间流程,自然能获得双倍效率。
(Source:The Verge)
这在实际游戏也可体现。今年初《星海争霸》AI 对抗赛,职业选手每分钟平均运算元为 250~500 左右,而 AI 可飙到 1,000+,且大部分都是有效操作,意味着 AI 可在极短时间下达更多复杂指令。
本次《雷神之锤 III 竞技场》比赛,据统计,人类的反应时间只有 AI 一半,且后者射击精准度可达 80%,人类只有 50%。
之后,哪怕 DeepMind 称已将 AI 的回应时间调整至与人类相似,人类战队依旧只能保证约 30% 胜率,证明在战术执行和决策部分,AI 依旧拥有优势。
这其实也没办法,单从训练量来说,DeepMind 的 AI 两周内玩的局数,积累了大约 200 年的游戏时间。
难怪有人评价,这种比赛毫无意义,因为 AI 本身就是外挂般的存在。
但人类也并非毫无优势,比如射击游戏的远距离狙击场景,职业玩家会展现出更好的视觉能力。
所幸,我们暂时不用担心碰到这么强的 AI 对手。毕竟,如果 AI 太聪明,看破你一切招数,玩家会心生明显的受挫感,玩游戏变成自虐,就不用指望卖出去了。
此外,比起游戏,现实世界还有很多值得 AI 投入的领域,《纽约时报》就评论,这些 AI 技能可运用在仓储管理机器人,还有自动驾驶系统等。
在 DeepMind 眼中,电子游戏仅是敲门砖,AI 真正需要掌握的是独立理解世界的能力,以及达成目标的手段,就算换成现实世界,也可以帮助人类。
(本文由 爱范儿 授权转载;首图来源:DeepMind)
延伸阅读:
- AI 能在围棋辗压世界冠军,为什么玩不好卡牌游戏?
- 多图详解 DeepMind 的超人类水准《星海争霸》AI“AlphaStar”
- 下个版本的 AlphaGo,会不会已经能认路了
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。