DeepMind AI 修练成精了，已经学会“发脾气”？

AI与大数据 5小时前 0

▼

DeepMind 又在“捏小人”了！这群小人是英华人工智慧实验室 DeepMind 生产的 AI，不过只能在游戏里看到。但你可能不知道的是，DeepMind 还训练过 AI 下象棋、玩足球、比电竞，甚至提出人工生命言论。

最近这群AI，竟然能直接跳过数据训练，在开放式任务环境自我进化。

之前Alpha Go和Alpha Star能力再强，也只能在各自擅长游戏放大招，超出范围立刻停摆。现在这批小人却能在不同游戏游刃有余完成任务，展现超强的泛用能力。难道人工智慧治好泛用“顽疾”了？

在抢夺高地金字塔的任务，两个不同颜色的小人能力值相当，都没有跳跃能力，开始发脾气乱扔东西，混乱中竟把其中一块板子“扔”成楼梯，长驱直入，任务完成！

多次实验发现，小人可复制方法，难道这群AI有记忆了？不仅如此，小人还学会“相对运动”──我上不去，你下来──借助板子直接把目标拉下来！甚至为了赢得比赛，多个小人学会配合，团体合作能力一直上升。

这种用虚拟游戏自我进化的AI，仅需人为搭建任务环境，设计大量任务目标，利用加强深度学习，一步步打通关，最终成为十八般武艺精通的AI。

（Source：DeepMind）

没有样本，没有经验，这些AI究竟如何进化，零样本学习是否意味这些AI具备基本的“自学意识”？

比起之前的足球场，这批AI的训练场更像游戏“社会”，有无数个游戏房，每房间游戏照竞争性、平衡性、可选性、探索难度分类。不管哪种任务，这批AI都只能从最简单开始，一步步解锁更复杂的游戏，整个游戏更像虚拟社会。

（Source：DeepMind）

无需大数据集训的AI，每玩一次游戏就成长一次，与各种环境互动和“奖励”下成长为更通用的AI，更像人工“生命”。

能让AI自我进化的关键在于正确设计初始智慧和进化规则。一开始都非常简单，所有复杂结构都是进化而来。就像婴儿不会做大人的事，任务核心是不要超出AI自身的改进能力。

据DeepMind说法，每个AI会在4千间游戏房玩约70万个游戏，并在340万个任务经历2千亿次训练步骤。1亿次步骤约耗时30分钟。照这训练法，41天就能训练出一群“成年”AI。

DeepMind表示“单AI可开发智慧成多目标，不仅一个目标”。AI公司Pathmind 的CEO Chris Nicholson也说“它学到的技能可举一反三。例AI学习抓取和操纵物体，就能完成敲锤子或铺床任务。DeepMind正用程式设计为AI在这世界设定目标，这些AI正在学习如何掌握。”

但南加州大学计算机科学副教授Sathyanaraya Raghavachary表示，这些AI并不能定义为“生命”，尤其关于AI拥有身体感觉、时间意识及理解目标几个结论。“即使人类也没有完全意识到身体这件事，更不用说人工智慧了。”

他表示，活跃的身体对大脑不可或缺，大脑要放在合适的身体意识和空间位置内进化。如果AI能理解任务，何必需要2千亿次模拟训练达到最佳结果？总体而言，虚拟环境训练的AI只是和以往AI“大同小异”。

狭义人工智慧是“复制人类行为的元素”，在计算机内执行某种任务，如分类图像、定位照片物件、定义对象边界等。这些系统旨在执行特定任务，而不具解决问题的一般能力。

相比之下，Deepmind使用的“通用人工智慧”有时也称为人类等级人工智慧，因可理解上下文、潜台词和社会线索，甚至认为可能完全超过人类。

但正如行为主义和认知主义的对抗，AI是否有解决问题的能力，并不能只考虑统计结果。善于“事后解释”任何行为，实验室之外还是无法“预测”哪些行动即将发生。

（本文由雷锋网授权转载；首图来源：shutterstock）

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。