11月13-14日 OFweek中国高科技产业大会

ALphaGo下一步行动揭秘:DeepMind训练其挑战《星际争霸II》

智慧机器人网 中字

  DeepMind开始训练AI星际争霸II,预计未来要挑战人类职业选手。(图/翻摄自NewScientist)

  2017年5月27日,DeepMind围棋AIAlphaGo以三战全胜之姿,大败世界棋王柯洁;站上围棋顶点後,AlphaGo的下一步终於揭晓,DeepMind与暴雪娱乐於8月9日宣布,推出一项新的研究计画,要训练AI击败即时战略游戏《星际争霸II》的顶尖人类选手。

  AlphaGo今年5月,以3战全胜之姿击败柯洁。(图/Google提供)

  其实早在2016年1月时,DeepMind执行长杰米斯.哈萨比斯就曾透露,希望能让AlphaGo进军《星际争霸》,不过一直未有进一步的动作,直到2017年8月8日,才正式宣布展开这项计画。

  星际争霸II是暴雪娱乐於2010年推出的即时战略游戏,由於其高度复杂性、丰富战术与节奏急促的游戏过程,常被认为是AI与人类的绝佳战场。

  为训练AI熟悉星际争霸II,DeepMind与暴雪娱乐共同推出一套工具,能让研究人员更轻松地开发AI选手;不过星际争霸对AI来说,是一项比围棋更艰难的目标,目前即使是业余玩家,也能轻松打败最强的AI。

  玩家需要生产军队、建造建筑与对手互相较量。(图/翻摄自星海争霸II官网)

  马尔他大学副教授GeorgiosYannakakis表示,“星际争霸是个生产军队、建造建筑,并在大地图上与对手较量的游戏。这游戏对AI来说十分困难的原因,在於比赛的可能性太多了。”

  据《NewScientist》报导,星际争霸一局可能的配置粗估多达10的1685次方种,相较之下,围棋可能的配置只有10的170次方种;这样的天文数字意指,即使数出全宇宙中的质子数量,或把宇宙从大爆炸开始至今的每一秒加起来,都没有星海争霸可能产生的配置多。

  更重要的是,与棋类游戏不同,星际争霸是两方实时进行的游戏,玩家每一秒都必须做出决策,进行操作。

  星际争霸II是高复杂性的即时对战,玩家需从手上有限的资讯,立刻做出判断。(图/翻摄自星际争霸II官网)

  此外,由於“战争迷雾”的关系,玩家无法掌握视野外的任何景象,只能从手上有限的资讯做出判断,这意谓着AI无法单纯依靠其压倒性的运算能力,计算出“暴力解”。

  不过,AI也不是毫无胜机,相较於人类有限的反应速度,AI在“手速”方面,占据相当大的优势,一名顶尖电竞选手的APM(每分钟动作数)顶多数百,然而AI却没有这样的限制,可在极短的时间内进行大量操作。

  DeepMind研究人员表示,到目前为止,他们的AI已成功掌握几项作业,如挖矿,但还不太能进行一场完整的游戏;不过,若能攻下星际争霸,就代表AI与人类生活又更近了一步,DeepMind工程师OriolVinyals表示,“游戏内容丰富,代表它是一条把AI与现实连通的有用桥梁。”


下载OFweek,高科技全行业资讯一手掌握

评论

(共0条评论

评论长度不能少于6个字

暂无评论

今日看点

2017“维科杯”中国高科技产业年度评选
还不是OFweek会员,马上注册
立即打开