伦敦DeepMind的一个研究团队与埃克塞特大学、伦敦大学学院和牛津大学的同事合作,训练了一个人工智能系统,以找到在网络游戏中公平分配公共资金的政策。在《自然-人类行为》杂志上发表的论文中,该小组描述了他们训练系统的方法,并讨论了他们在努力中提出的问题。
社会如何分配财富是人类数千年来不得不面对的问题。尽管如此,大多数经济学家都同意,尚未建立一个所有成员都满意现状的体系。收入水平总是不公平的,上层的人最满意,下层的人最不满意。在这项最新的研究中,英国的研究人员采用了一种新的方法来解决这个问题鈥攁要求计算机采取更符合逻辑的方法。
研究人员从一个假设开始,即民主社会尽管存在缺陷,但迄今为止是最令人满意的。然后,他们在志愿者的帮助下玩了一个简单的资源分配游戏鈥攖游戏玩家们共同决定了共享他们共同资源的最佳方式。为了更加现实,参与者在一开始就收到了不同数量的资源,有不同的分配方案可供选择。研究人员对不同组的志愿者进行了多次游戏。然后,他们使用所有游戏中的数据来训练几个人工智能系统,使其了解人类如何协同工作来找到解决此类问题的方法。接下来,他们让人工智能系统彼此玩类似的游戏,允许在多次迭代中进行调整和学习。
研究人员发现,人工智能系统已经确立了一种自由平等主义的形式,在这种形式下,玩家获得的资源很少,除非他们对社区人才库做出相应的贡献。然后,研究人员要求一组人类志愿者玩与之前相同的游戏,完成了他们的研究。只是这一次,他们可以选择使用几种传统的共享方法之一,也可以选择使用人工智能系统开发的方法鈥攖人工智能系统设计的一个是人类玩家的一致选择。
漏 2022年科学X网络