帮 AlphaGo 击败南韩李世乭的那个人:中国台湾资工博士黄士杰

帮 AlphaGo 击败南韩李世乭的那个人:中国台湾资工博士黄士杰

AlphaGo 首战击败南韩棋王李世乭,成为 9 日轰动科技界的大事。有人不免会拿漫画棋灵王(棋魂)来做比较,一个在背后遥控人类的灵魂,指挥下赢了当代一等一的棋手。如果 AlphaGo 是佐为的话,那么,与李世乭实际对战的那位“阿光”人类棋手又是谁呢?答案揭晓:他是中国台湾师范大学资工博士,黄士杰。

在第一场比赛,根据职业棋手认为,首战导致李世乭落败的原因并不在于 AlphaGo 的强大,而是他的轻敌。最明显表现是他的思考并不充分,所用的时间远远少于对手。

跟机器对战与跟人类对战的差异点在于,棋手原本会从现场对手的表现、下子的姿态来判断对方的心情、状况。但是与AlphaGo对决,那个“人”只是一个替代电脑下子的工具。李世乭无法从这个棋手的表现来判断,只能从对方下子的策略来观察。

但是 AlphaGo 首战的水准漂浮不定,在比赛开始前期犯下了一些低级错误,但后来又有一些妙招,让李世乭难以判断对手下棋的方式,并且可能是这个开始的错误导致李世乭的轻敌。

不过,如果他能与这位“阿光”多谈谈,或许就能多了解 AlphaGo 的“个性”。因为这位坐在他对面的人类棋手黄士杰,其实不光只是一个人类傀儡而已,他也是负责打造 AlphaGo 大脑的团队核心人物之一。

T客邦配图

▲ 之前 AlphaGo 击败欧洲欧洲围棋冠军樊麾(左)时,也是由黄士杰(右)担任人类棋手。

“深蓝”不是已经打败过西洋棋王了吗?围棋有什么难的?

有些网友说,早在多年前 IBM 的深蓝不是已经在 1997 年打败过棋王了吗?这次 AlphaGo 打败棋王又有什么大惊小怪?

问题是那次深蓝打败的是西洋棋的冠军,这次打败的是围棋冠军。围棋,被视为是目前难度最高的一项棋类比赛,难就难在围棋的变化高出西洋棋许多。因此击败人类的围棋冠军,一直是科学界发展人工智慧的重要目标。

以复杂度来说:

  • 西洋棋的复杂度为:10 的 123 次方。
  • 内地象棋的复杂度为:10 的 150 次方。
  • 日本将棋的复杂度为:10 的 226 次方。
  • 围棋的复杂度为:10 的 360 次方。

棋类比赛基本上都是利用搜寻树展开演算法,用搜寻树来判断对手下子的可能性,然后依照一些资讯来进行优劣判断,再来从多种可能的结果选出最好的一步来下子。

T客邦配图
T客邦配图

▲ 西洋棋每走一步,有 24 种可能性。而围棋则每一步有 200 种,再算下去将无穷无尽。

在西洋棋里面,电脑的搜寻树可以利用棋子的位置、棋子的数量来判断优劣,因此在树的展开可以依照每个棋局的局面来往下进行深度的搜寻。但是围棋的逻辑性没有那么强,比较难得到判断的方式。甚至有时你问顶尖棋手为什么当时要下某一子的时候,他也只能回答你“灵光乍现”,这也是为什么科技人工智慧这么想要在围棋上取得成果的原因。

 

黄士杰,一位热爱围棋的资工人

黄士杰是土生土长的中国台湾人,业余围棋六段,中国台湾师范大学资讯工程系硕士、中国台湾师范大学资讯工程系博士。他在 2002 年的硕士论文为“电脑围棋打劫的策略”,2010 年的博士论文为“应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法”。

他在这次比赛之后接受采访时表示:“Deepmind 应该是在 2014 年底之前、在 AlphaGo 团队出现之前就创建了。我本人喜欢下围棋,棋力是中国台湾业余六段,去年在德国的比赛我甚至赢过一位日本职业棋手。但 AlphaGo 肯定是比我强太多了。职业水准的围棋软件,应该最慢在 1-2 年之内就会在市面上普及。”

根据他在论文中表示,虽然电脑围棋的研究开始于 1970 年,但是围棋程式从未被人们认为是强大的。一直到 2006 年,当“蒙地卡罗树搜寻”与“树状结构信赖上界法”出现之后,才带来了围棋程式的革命。

蒙地卡罗是一种大数法则的方法,使用随机取样,而不用把所有的可能都估算到。但是当取样的次数越多,其所得出的平均值将趋近于理论值。这个方式应用在围棋时,会随机下子直到盘末,由此依据各点模拟的结果,来对于盘面进行优劣的评估,从中选出最好的下子方式。

这个方法多少带有点运气,但是当取样数量越多的时候,误差会相对变低。2006 年,法国科学家以蒙地卡罗方式发展出的 Crazy Stone 在 第 11 届电脑奥林匹克 99 比赛中获得了冠军。

T客邦配图

而“应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法”这篇博士论文的指导教授之一,正是 Crazy Stone的那位法国开发者 Rmi Coulom 博士。而拿到了博士学位的黄士杰,之后也曾获 2012 年中国台湾电脑对局学会博士论文奖与 2010 年19 路电脑围棋金牌。

最后,值得一提的是,在这份 2010 年他才发表的博士论文摘要中,有这样一段话:

“虽然电脑围棋的研究开始于 1970 年,但是围棋程式从未被人们认为是强大的。一直到 2006 年,当“蒙地卡罗树搜寻”与“树状结构信赖上界法”出现之后,才带来了围棋程式的革命。人们才开始相信,围棋程式在 10 年或者 20 年之后,将能够击败顶尖的人类棋手。”

现在,这份论文才发表不过 6 年的时间,他就亲手把自己的预言打破。

  • AlphaGo首战赢围棋王 幕后推手是中国台湾人

(本文由 T客邦 授权转载)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。