继《Dota 2》和《星海争霸》后，人类又一款竞技游戏败给 AI

AI与大数据 3小时前 0

▼

很多竞技射击游戏中，都能看到名为“夺旗”玩法。这源于西方传统运动，玩家分成两支队伍，目标是把对方基地的旗帜带回自己基地，同时要保护自己旗子不被抢走。

规则看似简单，可比起强调击杀得分的玩法，夺旗对团队配合和战术执行会要求更高，这往往需要几名玩家在进攻和防守间取得平衡点。

但这依旧没有难倒开发 AlphaGo 的 DeepMind 实验室。据 Arstechnica 报道，5 月 30 日《Science》期刊有一篇新论文，称新设计的 AI 程式已能在《雷神之锤 III 竞技场》展现和人类一样的行动模式，还能在夺旗游戏战胜人类队伍。

这也是继《星海争霸 II》和《Dota 2》后，DeepMind 又攻破的复杂竞技游戏。

《AlphaGo》影片中，DeepMind 创始人 Demis Hassabis 曾简单说明让 AI 理解围棋玩法的难点。

他说，相比西洋棋，围棋每颗棋子都有更多可走的路径，最终整个棋局变化数目，比全宇宙的原子总数还多。

DeepMind 实验室的挑战，就在于发明效仿人类直觉的进阶演算法，最终让它们像人类一样决策，展开行动。

换成第一人称射击游戏的夺旗，AI 需要有更快的即时决策能力，比如思考什么时间点做什么事才正确？如果两队的比数差较大，又该如何协调队友，采取什么策略才能扳回分数？

为了解决这个问题，DeepMind 实验室建立一套新的双层学习系统。

在内层，DeepMind 会让 AI 专注竞技比赛的核心目标，也就是赢得胜利，基于这点，AI 会再为整个游戏建立数个次级目标，寻求取胜的最短路径，比如跟随队友，或在敌人基地附近游走。

这有一些具象化的东西，比如训练过程中，DeepMind 团队采取“优胜劣汰”，让 AI 淘汰每一轮模拟赛表现最差的方案，然后再把最优秀方案的突出部分取出来，反复改进决策树。

外层部分，根据内层的决策情况来调整其他模组。比如说当内层认为防守战术是现在最好的选择，外层就会提升 AI 对四周环境的视觉感知能力，这样当敌人靠近基地时，AI 便能更快射杀。

这么看下来，DeepMind 开发的这套 AI 还是和人类很相似，内层就像人类“大脑”，主要负责战术策略；外层可当作人类的“眼睛和双手”，负责执行。

确定模型后，接下来就是一遍又一遍训练了。这次 DeepMind 团队投入约 3 周时间，让 AI 进行 45 万局游戏，相当于人类玩家花 4 年积累的时数，效率惊人。

进行到约 10 万场训练时，AI 队伍已达普通人类玩家的水准；20 万局训练后，AI 队伍已能击败职业玩家，且优势逐渐扩大。

另外，研究人员还在训练期间发现一些其他惊喜。比如 AI 会从神经网络分出一部分神经元，专门用于确认队友是否拿到旗子。

团队还使用随机生成的地图场景，为的就是不让 AI 靠地图取胜。

AI 游戏玩赢人类，靠的是什么？DeepMind 曾表示，这是基于强化学习演算法下的战术执行。

但也有不少人认为，AI 在竞技游戏的真正优势是超高手速和操作效率，且很多是人类玩家无法做到的。

原因很简单，我们玩电脑游戏时需要用到鼠标、键盘和摇杆，人类每次操作，都得先让大脑意识回馈到手指，然后再传到游戏。

但人类选手面对的 AI 并不是机器人，它们没有实体，所以下达指令时并不需要借助摇杆等工具，这等于砍掉了中间流程，自然能获得双倍效率。

（Source：The Verge）

这在实际游戏也可体现。今年初《星海争霸》AI 对抗赛，职业选手每分钟平均运算元为 250~500 左右，而 AI 可飙到 1,000+，且大部分都是有效操作，意味着 AI 可在极短时间下达更多复杂指令。

本次《雷神之锤 III 竞技场》比赛，据统计，人类的反应时间只有 AI 一半，且后者射击精准度可达 80%，人类只有 50%。

之后，哪怕 DeepMind 称已将 AI 的回应时间调整至与人类相似，人类战队依旧只能保证约 30% 胜率，证明在战术执行和决策部分，AI 依旧拥有优势。

这其实也没办法，单从训练量来说，DeepMind 的 AI 两周内玩的局数，积累了大约 200 年的游戏时间。

难怪有人评价，这种比赛毫无意义，因为 AI 本身就是外挂般的存在。

但人类也并非毫无优势，比如射击游戏的远距离狙击场景，职业玩家会展现出更好的视觉能力。

所幸，我们暂时不用担心碰到这么强的 AI 对手。毕竟，如果 AI 太聪明，看破你一切招数，玩家会心生明显的受挫感，玩游戏变成自虐，就不用指望卖出去了。

此外，比起游戏，现实世界还有很多值得 AI 投入的领域，《纽约时报》就评论，这些 AI 技能可运用在仓储管理机器人，还有自动驾驶系统等。

在 DeepMind 眼中，电子游戏仅是敲门砖，AI 真正需要掌握的是独立理解世界的能力，以及达成目标的手段，就算换成现实世界，也可以帮助人类。

（本文由爱范儿授权转载；首图来源：DeepMind）

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。