深度分析:星际2人工智能征服人类?还需时日

  北京时间1月25日凌晨2点,暴雪与谷歌DeepMind团队合作研究的星际争霸人工智能“AlphaStar”正式通过直播亮相。按照直播安排,AlphaStar与两位《星际争霸2》人类职业选手进行了5场比赛对决演示。加上并未在直播中演示的对决,在人类vs AlphaStar人工智能的共计11场比赛中,人类只取得了一场胜利。

  这场大战以人工智能的近乎完胜而告终。从结果来看,人类似乎很快就无法在《星际争霸2》这款难度非常高的游戏上与人工智能相抗衡。

  本文将会以较专业的星际技战术角度出发,通过较为通俗的讲解,帮助大家理解这场胜利的意义究竟在哪里。

  (特别鸣谢KevinLiu对本文中人工智能专业内容指导)

  1. 这场胜利真的意味着《星际争霸2》中人工智能已经可以战胜顶尖人类了吗?

  尽管这次比赛人类没有派出当前实力最强状态最好的职业选手出战,但显然已经有很多朋友希望通过”人工智能是否已经具备战胜人类职业选手的实力“来参考不久的未来人工只能是否有机会“击败全人类”。

  所以回答这个问题其实需要一个必要条件。那就是看如何看待挑战人类的人工智能。以绝大部分星际2的专业人士看法,如果人工智能战胜人类,应该是通过和人类差不多的操作或是比人类对游戏更先进的战术理解来取胜,才足以让人信服。

  那么这次比赛中两位输给人工智能的选手能够让人信服吗?

  恐怕很难。

  第一个出战的TLO在比赛中使用了他不擅长的种族,所表现出的技战术实力只能达到普通业余玩家的水平,甚至连业余高手都略有勉强。那么自然也就没有了参考“战胜职业选手“的意义了。只能说,与TLO对决的这款AlphaStar,已经拥有了在PvP(神族vs神族)对抗中略强于一些业余玩家的技战术水平了。

  第二个出战的MaNa可是正经的使用最擅长种族的职业选手了,巅峰时期也曾拿过暴雪世锦赛的亚军。但MaNa依然输给了人工智能。

  这场胜利有参考意义吗?

  客观的说,还有异议。

  大部分人持反对意见的原因非常明显,战胜MaNa的这款AlphaStar拥有着超乎人类生理极限的操作能力。

  毕竟人类希望和围棋一样,在一个相对平等的条件下与人工智能对决,从而让人类认识对这个游戏玩法的认知积累是否还存在缺陷。

  所以在如何保证平等条件的争论中,是否需要像人类一样模拟受迫性失误、是否需要像人类一样有反应阈值一直都存在激励争议。但在是否拥有超越人类胜利极限的运动能力上,确是争论极少的,毕竟人们在对人工智能对抗人类的主流认知中,是希望人工智能对手也是个虚拟的人。

  回顾MaNa和AlphaStar的那五场大战,以在直播中播放的一场比赛为例,AlphaStar所展示的三线追猎牵制操作是人类几乎不可能完成的。完成这种操作必须要在那长达1分多的时间内保持非常快的手速、精准的鼠标点击、精准的屏幕移动以及距离判断,更重要的是要杜绝人类基本无法克服的受迫性失误。

  通俗点说,如果同样是带兵打仗,我的排兵布阵和打仗策略和你差不多,但你的部队不知疲倦,我军打累了要休息而敌军依然还能扛着大刀往前杀,那就有点赖皮了。

  除此以外,目前的AlphaStar在技术上仍有很大的局限性。从当天的比赛来看,目前DeepMind能向大家展示的只能局限在唯一的地图、唯一的种族对抗以及唯一的平衡性环境中。相比需要应对每个赛季至少4-5张不一样的地图、三个不同种族对抗、经常修改的平衡性版本的人类职业选手来说,就好比踢足球AlphaStar只和你比射点球,那怎么能算战胜人类?

  但从纯粹的技战术角度来讨论,这一次人工智能大战还是给了人类一些启发,主矿的农民分配以及一些运营补农民的思路,确实给了一些核心星际玩家新的思路。

  尽管抛开单纯的比分结果并不能让我们信服人工智能已经可以挑战甚至战胜职业选手,但从它所表现出的潜力已经学习程度来看,仍然是值得期待的。

  2. 人工智能有哪些值得星际专业人士赞叹的地方?

  在第一个问题中我们似乎一直在唱衰DeepMind团队研发的AlphaStar。但严格来说,DeepMind首次公开AlphaStar对于星际专业人士来说,仍然超出了预期,非常值得赞叹。

  和一些命名为人工智能的星际脚本程序相比,AlphaStar更像我们想象的人工智能了,它会灵活的使用战术,作出更像是经过”思考“后的游戏指令。

  AlphaStar所展现出的学习能力已经非常强大。它甚至已经学会判断优先攻击哪个目标、学会怎样使用对手的战术、以及基础的判断对手的打法和使用反制打法的能力,完成这些在我们看来比较抽象化的逻辑能力,就需要更加强大的算法能力了。

  更加复杂的算法带来更加拟人化的高级逻辑推理能力也是DeepMind选择用《星际争霸2》来攻克人工智能技术瓶颈的原因之一。对于星际玩家来说 ,更加强大的逻辑能力自然有可能会诞生更多人类还没想到的新战术、新运营和新打法体系,这是非常值得期待的。

  3. 未来的《星际争霸2》人工智能vs人类大战会是怎样?

  要知道这次参赛的AlphaStar只进行了为期一周的自我对练和学习,但学习量已经相当于正常人的200年,这和AlphaGo一样,人工智能有着非常恐怖的算力。但毕竟目前技术水平的人工智能还不能像相对变数更少的的围棋那样完全驾驭和领悟《星际争霸2》这款游戏(在笔者之前撰写的《星际争霸人工智能AlphaStar比赛速记》中对此有详细阐述),因此即使有着 200年的学习量,今天所展示出的AlphaStar对游戏的整体理解能力依然不如只有短短数年学习量的人类强。

  以目前的技术水平来看,AlphaStar的技术提升可能会存在很大的瓶颈。如果未来在算法上有较大的技术进步,AlphaStar可能会有非常大的学习进步,那么战胜人类最强职业选手或 是为人类启发新的《星际争霸2》打法就真的可以实现了。

  届时,AlphaStar自然也就不用再限定死地图和对抗种类,也不用再依靠超过人类极限的操作能力,它会真正意义上的告诉你《星际争霸2》应该怎么玩,会像AlphaGo那样告诉人类:你们的地标最强,在我们看来只是简单电脑;你们公认的最优玩法,完全就是乱打一通。

  4. 你一定会搞混它们:《星际争霸2》中的人工智能与脚本

  其实早在AlphaStar在今天公开打《星际争霸2》之前,很多星际玩家会误以为AlphaStar是一个类似于悍马2000。

  悍马2000是一个《星际争霸2》的程序脚本,它能够为人类展示人类理想中最完美的游戏操作。比如最广为人知的散枪兵无损杀光毒爆、2000只小狗最低损失冲锋坦克阵。

  这类似 于之前我们提到的超出人类生理极限的操作。此类极限的操作是通过提前在程序中写好了 条件—动作 的指令,例如毒爆与枪兵的距离小于某个阀值的时候,触发枪兵向毒爆运动的反方向移动,等等类似指令来实现的。

  但如果用悍马2000这样的脚本和人类进行对决其实没有什么实际的意义,因为人类的知识和理解总是有限的,在有限的知识下,写死大量的 条件—动作 指令,最后总会有人类无法预知的情况出现,脚本Bot就会陷入困境,从而被人类轻松击败。而AlphaStar是学习型的,通过大量的对局自主学习,优化自己的每一次决策,从而提高自己的游戏水平。这样的人工智能,是能够做出逻辑推导能力,局势分析能力甚至是和对手的心理、战术交互。毕竟《星际争霸2》是一款即时战略游戏。

  至于脚本与人工智能的区别,相信很多朋友已经能从上文中理解了,脚本只是写死的程序,它不能和你来一次真正意义上的,智能的即时战略游戏对抗;而人工智能会判断你的打法,通过对局势的判断,输出一个最有价值的策略,在人类看来就是它用了多变的打法来挑战你。其实严格的来说,目前以AlphaStar为代表的顶尖技术人工智能也是一个更加高级复杂的脚本,它的所有抉择都是基于相比人类编写的脚本更加高级复杂的推导,学习与拟合。只是最后打出来的结果,以人类的感性视角看来,人工智能具备”独立思考能力“。

  5. DeepMind研究AlphaStar的意义?

  在当天在直播结尾,DeepMind提到,AlphaGo通过围棋战胜人类是人工智能AI的一个里程碑。但人类之所以为人类,就是能从不同结果中学习,DeepMind希望找出能和人类一样的自我学习算法。这个长期的计划对于人类在未来意义重大。

  通过挑战这款每一帧都存在变化、信息不对等还有其他复杂条件的游戏,让人工智能实现新的技术突破,最终以寄希望它能用于人类社会中,造福人类生活。

星际争霸2

进入专区>>
  • 游戏类型:竞技游戏
  • 开发公司:暴雪娱乐
  • 运营公司:网易游戏
  • 发行平台:PC

你对该游戏感兴趣吗?