ALphaGo下一步行动揭秘：DeepMind训练其挑战《星际争霸II》

　　DeepMind开始训练AI星际争霸II，预计未来要挑战人类职业选手。（图／翻摄自NewScientist）

　　2017年5月27日，DeepMind围棋AIAlphaGo以三战全胜之姿，大败世界棋王柯洁；站上围棋顶点後，AlphaGo的下一步终於揭晓，DeepMind与暴雪娱乐於8月9日宣布，推出一项新的研究计画，要训练AI击败即时战略游戏《星际争霸II》的顶尖人类选手。

　　AlphaGo今年5月，以3战全胜之姿击败柯洁。（图／Google提供）

　　其实早在2016年1月时，DeepMind执行长杰米斯．哈萨比斯就曾透露，希望能让AlphaGo进军《星际争霸》，不过一直未有进一步的动作，直到2017年8月8日，才正式宣布展开这项计画。

　　星际争霸II是暴雪娱乐於2010年推出的即时战略游戏，由於其高度复杂性、丰富战术与节奏急促的游戏过程，常被认为是AI与人类的绝佳战场。

　　为训练AI熟悉星际争霸II，DeepMind与暴雪娱乐共同推出一套工具，能让研究人员更轻松地开发AI选手；不过星际争霸对AI来说，是一项比围棋更艰难的目标，目前即使是业余玩家，也能轻松打败最强的AI。

　　玩家需要生产军队、建造建筑与对手互相较量。（图／翻摄自星海争霸II官网）

　　马尔他大学副教授GeorgiosYannakakis表示，“星际争霸是个生产军队、建造建筑，并在大地图上与对手较量的游戏。这游戏对AI来说十分困难的原因，在於比赛的可能性太多了。”

　　据《NewScientist》报导，星际争霸一局可能的配置粗估多达10的1685次方种，相较之下，围棋可能的配置只有10的170次方种；这样的天文数字意指，即使数出全宇宙中的质子数量，或把宇宙从大爆炸开始至今的每一秒加起来，都没有星海争霸可能产生的配置多。

　　更重要的是，与棋类游戏不同，星际争霸是两方实时进行的游戏，玩家每一秒都必须做出决策，进行操作。

　　星际争霸II是高复杂性的即时对战，玩家需从手上有限的资讯，立刻做出判断。（图／翻摄自星际争霸II官网）

　　此外，由於“战争迷雾”的关系，玩家无法掌握视野外的任何景象，只能从手上有限的资讯做出判断，这意谓着AI无法单纯依靠其压倒性的运算能力，计算出“暴力解”。

　　不过，AI也不是毫无胜机，相较於人类有限的反应速度，AI在“手速”方面，占据相当大的优势，一名顶尖电竞选手的APM（每分钟动作数）顶多数百，然而AI却没有这样的限制，可在极短的时间内进行大量操作。

　　DeepMind研究人员表示，到目前为止，他们的AI已成功掌握几项作业，如挖矿，但还不太能进行一场完整的游戏；不过，若能攻下星际争霸，就代表AI与人类生活又更近了一步，DeepMind工程师OriolVinyals表示，“游戏内容丰富，代表它是一条把AI与现实连通的有用桥梁。”

相关推荐