DeepMind AI 修练成精了,已经学会“发脾气”?

DeepMind AI 修练成精了,已经学会“发脾气”?

DeepMind 又在“捏小人”了!这群小人是英华人工智慧实验室 DeepMind 生产的 AI,不过只能在游戏里看到。但你可能不知道的是,DeepMind 还训练过 AI 下象棋、玩足球、比电竞,甚至提出人工生命言论。

DeepMind AI 修练成精了,已经学会“发脾气”? AI与大数据 图2张

最近这群AI,竟然能直接跳过数据训练,在开放式任务环境自我进化。

之前Alpha Go和Alpha Star能力再强,也只能在各自擅长游戏放大招,超出范围立刻停摆。现在这批小人却能在不同游戏游刃有余完成任务,展现超强的泛用能力。难道人工智慧治好泛用“顽疾”了?

在抢夺高地金字塔的任务,两个不同颜色的小人能力值相当,都没有跳跃能力,开始发脾气乱扔东西,混乱中竟把其中一块板子“扔”成楼梯,长驱直入,任务完成!

多次实验发现,小人可复制方法,难道这群AI有记忆了?不仅如此,小人还学会“相对运动”──我上不去,你下来──借助板子直接把目标拉下来!甚至为了赢得比赛,多个小人学会配合,团体合作能力一直上升。

这种用虚拟游戏自我进化的AI,仅需人为搭建任务环境,设计大量任务目标,利用加强深度学习,一步步打通关,最终成为十八般武艺精通的AI。

DeepMind AI 修练成精了,已经学会“发脾气”? AI与大数据 图3张

(Source:DeepMind

没有样本,没有经验,这些AI究竟如何进化,零样本学习是否意味这些AI具备基本的“自学意识”?

社会达尔文主义训练场

比起之前的足球场,这批AI的训练场更像游戏“社会”,有无数个游戏房,每房间游戏照竞争性、平衡性、可选性、探索难度分类。不管哪种任务,这批AI都只能从最简单开始,一步步解锁更复杂的游戏,整个游戏更像虚拟社会。

DeepMind AI 修练成精了,已经学会“发脾气”? AI与大数据 图4张

(Source:DeepMind)

无需大数据集训的AI,每玩一次游戏就成长一次,与各种环境互动和“奖励”下成长为更通用的AI,更像人工“生命”。

能让AI自我进化的关键在于正确设计初始智慧和进化规则。一开始都非常简单,所有复杂结构都是进化而来。就像婴儿不会做大人的事,任务核心是不要超出AI自身的改进能力。

据DeepMind说法,每个AI会在4千间游戏房玩约70万个游戏,并在340万个任务经历2千亿次训练步骤。1亿次步骤约耗时30分钟。照这训练法,41天就能训练出一群“成年”AI。

但AI还是不会思考

DeepMind表示“单AI可开发智慧成多目标,不仅一个目标”。AI公司Pathmind 的CEO Chris Nicholson也说“它学到的技能可举一反三。例AI学习抓取和操纵物体,就能完成敲锤子或铺床任务。DeepMind正用程式设计为AI在这世界设定目标,这些AI正在学习如何掌握。”

但南加州大学计算机科学副教授Sathyanaraya Raghavachary表示,这些AI并不能定义为“生命”,尤其关于AI拥有身体感觉、时间意识及理解目标几个结论。“即使人类也没有完全意识到身体这件事,更不用说人工智慧了。”

他表示,活跃的身体对大脑不可或缺,大脑要放在合适的身体意识和空间位置内进化。如果AI能理解任务,何必需要2千亿次模拟训练达到最佳结果?总体而言,虚拟环境训练的AI只是和以往AI“大同小异”。

从理论到现实的路还很长

狭义人工智慧是“复制人类行为的元素”,在计算机内执行某种任务,如分类图像、定位照片物件、定义对象边界等。这些系统旨在执行特定任务,而不具解决问题的一般能力。

相比之下,Deepmind使用的“通用人工智慧”有时也称为人类等级人工智慧,因可理解上下文、潜台词和社会线索,甚至认为可能完全超过人类。

但正如行为主义和认知主义的对抗,AI是否有解决问题的能力,并不能只考虑统计结果。善于“事后解释”任何行为,实验室之外还是无法“预测”哪些行动即将发生。

  • Is DeepMind’s new reinforcement learning system a step toward general AI?

(本文由 雷锋网 授权转载;首图来源:shutterstock)

延伸阅读:

  • 为了让 AI 不断打怪升级,DeepMind 打造“宇宙”

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。