首先,由谷歌的DeepMind创建的人工智能掌握了Go游戏。现在,它正在击败星际争霸的专业人士,这是一款受欢迎的科幻策略游戏。
DeepMind周四表示,一个名为AlphaStar的人工智能节目最近赢得了与电视游戏“星际争霸II” 中的两个职业玩家进行的所有10场比赛中国机械网okmao.com。
这一壮举表明计算机在解决复杂问题方面越来越好。DeepMind是一家总部位于伦敦的人工智能公司Google (GOOG)于2014年收购的公司,多年来一直专注于此。
该公司之前因建立人工智能的名称AlphaGo而名声大噪,该公司击败了拥有2,500年历史的游戏Go的职业玩家。这是计算机科学家长期以来努力用人工智能实现的一项壮举,因为Go涉及玩家交替将黑白石头放置在19×19网格上,可以播放几乎无限次的动作。

由于其复杂性和对策略的依赖性,“星际争霸II”对于计算机而言比其他许多游戏更难掌握。在科幻游戏中,玩家可以扮演三个不同的星系群(人族,虫族或神族)的角色,并争取控制星系。在周四的博客文章中,DeepMind概述了人工智能面临学习玩“星际争霸II”的挑战,例如玩家无法立即看到所发生的一切以及使用连续游戏(而不是玩家轮流)。
12月,AlphaStar作为Protoss参加了比赛,赢得了五场比赛,DarioWünsch是一名德国球员,由玩家处理TLO并且还扮演Protoss(虽然不是他专攻的组合)。一周之后,人工智能再次赢得了五场比赛,这一次是针对一个更强硬的Protoss竞争对手:Grzegorz Komincz,来自波兰的职业玩家,名为MaNa。
DeepMind周四在YouTube和Twitch 的直播中宣布了胜利。
研究人员使用了一种比赛风格的方法训练AlphaStar。首先,他们花了三天的时间训练神经网络 - 一种以神经元在大脑中工作的方式建模的机器学习算法 - 重播人类玩家的星际争霸II游戏。这个神经网络用于创建一些基于计算机的竞争对手,这些竞争对手在两周的时间里相互比较,从他们的经历中学习了很多轮。
DeepMind表示它使用了五个顶级人工智能竞争对手 - 所以,五个不同版本的AlphaStar - 来对抗Komincz和Wünsch的每个游戏。它还使用了比赛之间的一周来改善AI。
DeepMind的联合首席研究员David Silver表示,建立AlphaStar的团队对公平性有很多想法,并希望机器人以类似于人类的方式玩游戏。例如,通过在游戏中每分钟不采取比一个人更多的动作。
尽管如此,人工智能仍在反复击败人类。
“每一场比赛,我都是在黑暗中,”Wünsch在现场直播中表示,并补充说他必须不断搞清楚新战略。
至少,Komincz在周四赢得了一些赎回:他在比赛的现场直播比赛期间击败了更新版的AlphaStar。
尽管AlphaStar刚刚接受过星际争霸II作为神族的训练,但DeepMind研究科学家Oriol Vinyals表示,该公司计划对其进行训练,以便与其他群体一起玩。