由OpenAI团队开发的一种新算法(由Elon Musk支持)允许首先在虚拟现实环境中演示一个人来教机器人如何做某事。正如研究人员所指出的那样,该计划是基于该公司称为一次性模仿学习的东西。
随着计算机硬件的改进,它已不断应用于机器人技术,从而创建了越来越有用的机器中国机械网okmao.com。这类机器人背后的软件也在不断发展,从简单的命令驱动系统到结合了各种硬件和学习机制的复杂方案。在这项新工作中,OpenAI团队增加了新的变化,使机器人可以通过观看在虚拟世界中所做的事情来学习如何做某事。
先前的机器人学习系统依赖于允许机器人观看现实世界中完成的事情或通过使其零件物理地移动然后记住发生的事情,但是这种方法具有局限性和缺点,因为它们存在于现实世界中。创建虚拟世界可以添加支持学习过程的元素。
例如,在OpenAI的这项新工作中,研究人员能够首先教会机器人有关块,块的颜色,位置以及堆放在桌子上的外观的方法-所有这些都通过在一个机器人上展示这些元素的多个示例来完成。虚拟世界在很短的时间内。在现实世界中做同样的事情需要花费数小时,数周甚至数月的时间。
一旦机器人了解了可能性,它就会将该信息用作可供使用的两个神经网络之一-第一个是视觉网络,它实质上了解了可能的事物。
然后,机器人访问称为模仿网络的第二个神经网络,该网络使用来自第一个网络的信息以及它学到的知识来设计一种模仿场景的策略,它观察到机器人拾起并堆叠了块-由人工控制虚拟机器人的人创建。结果是,机器人仅需查看一次即可在虚拟世界中学习人类演示的任务。
OpenAI的团队注意到结果似乎很简单,但他们指出,该算法和系统本身可以进行编程,以比其他系统更快,更有效的方式教机器人一个各种各样的任务。