大学教授研发“中国版AlphaGo” 相当于业余二段
中国新闻北京青年报 2016年03月14日 09:47
我要分享
原标题:
2015年,在民间被称为“中国版的AlphaGo”的“MyGo”软件,在世界计算机围棋锦标赛上对抗国际同类程序供图/武坤
“中国版AlphaGo”相当于业余二段
中南大学教授开发围棋人工智能“MyGo” 国内两届冠军世界大赛仅得第7
李世石又输了,AlphaGo连胜三场。就在人们热议人类是否要在围棋领域完败的时候,一些棋友却开始想到武坤和他的“MyGo”,并将其称为“中国版的AlphaGo”。而武坤自己却表示,他的“MyGo”即便能在国内夺冠,但与AlphaGo对比,远远无法望其项背。
武坤是中南大学数学与统计学院教授,他的“MyGo”也是一款围棋人工智能。2015年11月,首届美林谷杯世界计算机围棋锦标赛在北京工体附近进行,在来自全世界的参赛队中,“MyGo”只属于第三梯队,相当于围棋业余二段的水平,而锦标赛的冠军也无非围棋业余五段水平。那时谁也没想到,仅仅四个月后,他们全都被AlphaGo横扫了。职业九段的李世石惨败,而且还是三连败。
制作三个月 研发用了三年
在中南大学,武坤对于围棋的热爱,所有上过他课的学生都知道。武坤甚至专门开了一门课程,就叫“围棋人工智能”。
他的“MyGo”诞生于2011年,制作过程只用了三个月,但研究过程却是三年。2008年,武坤认识了职业八段围棋选手王群,和王群的交流让他发现,职业围棋选手的思维和一般人有明显的区别,而这种区别可以用软件的形式表现出来,他说这就是制作“MyGo”最早的念头。
“二十岁不成为国手,则终身无望”,这是围棋界的常识,学围棋必须从小开始,但武坤直到上了大学才开始接触围棋。制作“MyGo”之前,武坤没做出过任何软件,而“MyGo”的前三年“全都在做理论基础”。武坤告诉北青报记者:“比如最简单的问题,大家都知道执黑先走,但是先走的是有优势的,因此围棋规则都会给执白棋的棋手一些优惠,即‘贴目’,那么这个‘贴目’到底多少合适呢?围棋发展几千年了,一直都是凭感觉来定的。”武坤说,包括“贴目”在内的诸多围棋要素,都需要进行数据化,这个过程最久也最艰难。
跨过“理论基础”这个坎,武坤和他的团队就用了三年。
全国冠军也只是世界第三流
2012年,武坤带着“MyGo”的第一版参加了全国计算机博弈锦标赛,这是中国一个专门供计算机围棋人工智能比赛的平台。据介绍,该比赛的主办方包括中国人工智能学会和中国棋院,比赛项目除了围棋,还有象棋、六子棋等,是各种“中国版AlphaGo”的竞技场。
第一次参赛,武坤的“MyGo”只拿到了全国第三,2013年第二次参赛还是第三名。武坤和学生们做了数十次改进之后,2014年第三次参赛,“MyGo”终于获得了全国冠军,又在其后的2015年蝉联冠军,这时起,“MyGo”终于出名了。
虽然现在有人把“MyGo”捧为中国版的AlphaGo,但武坤自己认为,横扫了李世石的AlphaGo跟传统意义上的围棋人工智能根本就不是同一种东西。
2015年,新科中国冠军的“MyGo”走上了国际赛场,在首届美林谷杯世界计算机围棋锦标赛上,“MyGo”八战两胜六负,在9支参赛队伍中仅排名第七。武坤表示:“前三名的人工智能算是第一梯队,第四到第六名算是第二梯队,而‘MyGo’只能算第三梯队,和前两个梯队之间的差距很明显,很难下赢。”
但这还不是跟AlphaGo的差距。AlphaGo虽然没有参加2015年世界计算机围棋锦标赛,但在这场赛事前一个月,AlphaGo已经“小试牛刀”了。AlphaGo在2015年10月与欧洲围棋冠军职业二段选手樊麾进行了五场对决,樊麾被无情碾压,AlphaGo以5:0完胜。之后樊麾观摩了2015年世界计算机围棋锦标赛,他提出参赛的围棋人工智能水平和AlphaGo“根本无法相提并论”。
AlphaGo技术远超同类程序
在AlphaGo手里三连败,沮丧的并不只有李世石,还有武坤。“本以为我们的‘MyGo’和世界最强的人工智能只有业余二段到业余五段的差距,现在我们根本没法估算跟AlphaGo的差距。”
武坤解释说,相比其他围棋人工智能,AlphaGo的程序算法非常先进。“现如今,围棋人工智能经历了三代算法,第一代是穷举算法,即尝试把所有可能的下法都算出来,然后取必胜的一个。如果能够穷举,那么人类注定无法战胜人工智能,因为所有的变化都在人工智能的掌握之中了。这对于国际象棋还有可能,但对于围棋来说就不现实。”武坤说,包括“MyGo”在内,2015年参赛的9支队伍中8支都采用了第二代算法,这种算法利用高频次的随机抽样、动态评估、规划路径,选择胜率最高的走法,也就是说并不试图穷尽所有的下法,而只是抽选一部分下法,然后选出胜率最高的那一种。这种算法大大提升了围棋人工智能的水平,使得其可以和业余选手一较高低。但即使获得了2015年全球锦标赛冠军的韩国人工智能“石子旋风”,在和职业七段围棋选手连笑的对决中,先后在“人类让四子”、“人类让五子”的比赛中落败,直到连笑为“石子旋风”“让六子”,“石子旋风”才获得一次险胜。
而AlphaGo的算法就远远超越了之前的算法,利用人工智能自我学习的能力获得了飞跃。武坤说,其实类似AlphaGo这样的人工智能也曾经在2015年的锦标赛上出现过,即法国的GoLois,这款法国围棋人工智能可以模拟人脑神经元,具有主动识别、自适应等功能,在图像处理方面也异常强大。然而由于技术还不成熟,在所有9款围棋人工智能中排名垫底。“当时我们大家就感觉到了这种模拟人脑思维的算法的巨大潜力,但是没想到,类似的人工智能来得这么快,这么猛。”
尽管如此,武坤对于未来仍有信心。他打了个比方:就像电脑发明之后,很快诞生了各种更新型的电脑一样。“之前大家都是在寻找方向,现在AlphaGo为我们开辟了一个了不起的方向。随着大家对新算法的深入研究,相信会有大批类似AlphaGo的围棋人工智能出现,到那时中国也会有能做出超越世界超一流棋手的围棋人工智能,那才是真正的‘中国版AlphaGo’。”(文/本报记者 屈畅)