欧洲游戏玩家被邀请接受由世界领先的人工智能研究人员开发的机器人。
但是有一个转折:球员不会被告知什么时候他们对抗它。
这项测试由总部位于伦敦的人工智能公司DeepMind进行,该公司之前创建的计划打败了世界顶级的Go玩家中国机械网okmao.com。
在这种情况下,挑战涉及科幻视频游戏星际争霸II。
它被认为是一项更复杂的任务,因为玩家只能对其对手的行为进行部分概述,而不像中国棋盘游戏Go所展示的所有作品。
此外,两名星际争霸玩家都会同时移动他们的军队,而不是轮流。
DeepMind - 由谷歌的父母Alphabet所有 - 已经表示其机器人AlphaStar正在匿名播放,以便尽可能接近正常的匹配情况。令人担忧的是,如果人们确信他们正在与电脑对战,那么他们可能会有不同的表现。
但是,如果游戏玩家首先选择参与实验,他们将只面对算法控制的系统。
DeepMind并没有说它何时或多久会为人类玩家部署AlphaStar代理
如果他们输了,那么他们的比赛评分(MMR)分数将会受到影响,从而降低他们对其他球员的排名并影响他们升级到更高联赛的可能性。
英国领先的球员之一表示星际社区对AlphaStar的表现有很大的兴趣。
“这是一个隐藏信息的游戏,并且在知识非常有限的情况下做出决策,”肯特的Raza Sekha解释道。
“人们非常想知道DeepMind是否会创新并提出新的战略思想。
“这将是一项非常伟大的成就,但我认为很多人都不希望这种情况发生。”
Deepmind联合创始人为伦敦青少年提供了最佳技巧
英国军方担心机器人会从电子游戏中学习战争
人类在星际争霸的视频游戏中麻烦AI机器人
然而,AlphaStar的前辈们在国际象棋游戏Go和shogi中提出了创造性策略,这些策略反过来影响了一些顶级人类玩家改变他们自己的策略。
强化学习
这不是AI研究人员首次尝试通过视频游戏推动该领域。
去年,总部位于旧金山的OpenAI报道了一项突破,当时它有效地创造了一个“好奇”的特工,以在蒙特苏马的复仇中获得高分。
尽管是一个古老的视频游戏,研究人员一直在努力教AI代理人探索Montezuma的复仇室
由于微软开发了一个特殊版本的块建筑标题,Minecraft中也开展了一系列机器学习实验。
而DeepMind本身则通过培养自己如何玩包括突围和太空入侵者在内的数十种Atari游戏的代理商而崭露头角。最近,它创建了与Quake III Arena中的人类队友一起玩的软件。
这些现成的虚拟环境提供了一种执行称为强化学习的过程的方法。这涉及到代理人通过反复试验的过程发现自己表现得更好的方法,获得成功的“奖励”而不是被告知要做什么。
在某些情况下,代理人从头开始自学。但是在AlphaStar的情况下,它首先通过参考过去的比赛来训练模仿人类游戏,然后对其他版本的自身进行释放以进一步提高性能。
残疾人工智能
AlphaStar的进步并非没有争议。
有些玩家觉得它在早期比赛中有不公平的优势,因为它可以同时看到一个游戏的整个地图,比人类更详细。
“作为一个人,游戏中最困难的部分之一就是多任务处理,”Sekha先生解释道。
“把注意力分散在两个地方真的很难。
DeepMind打算在发布研究时发布比赛与人类的重播
“因此,人工智能有一个至关重要的优势,它可以同时看到所有地方,因为它可以让它几乎同时进行攻击和防御,而人类必须选择是否最好做一个或另一个。”
为了解决这个问题,代理商已经进行了调整,以便像人类一样使用游戏地图。它现在必须放大到一个部分来确定其中的动作,并且只能将单位移动到视图中的位置。
DeepMind还减少了AlphaStar每分钟可以采取的行动,以解决其他批评问题。
但塞卡先生表示,仍有一些悬而未决的问题。
“如果能够从一台摄像机快速切换到另一台摄像机,速度比人类快得多,那仍然有点不公平,”他说。
“因此,看看他们采取了哪些措施来平衡竞争环境将会非常有趣,因为上次社区认为它有点过分支持人工智能了。”
作为科学研究论文的一部分,DeepMind打算分享有关该项目的更多细节,但尚未确定何时发布。