返回顶部
今日    | 手机版 | 资讯 | 产品 | 企业 | 热点 | 商道 | 原料 |
返回首页
返回首页
home 您现在的位置: 首页 >行业资讯 > 详细信息
一种模仿学习方法来训练机器人,而无需进行实际的人类演示
2020年10月10日    阅读量:786     新闻来源:中国机械网 okmao.com    |  投稿

大多数人可以通过观察他人仅执行一次任务来学习如何完成给定任务。但是,被编程为通过模仿人类学习的机器人通常需要在一系列人类演示中进行训练,然后才能有效地复制所需的行为。


一种模仿学习方法来训练机器人,而无需进行实际的人类演示 中国机械网,okmao.com


研究人员最近能够使用元学习方法,通过让机器人观察单个人类演示,来教机器人执行新任务中国机械网okmao.com。但是,这些学习技术通常需要现实世界中的数据,这些数据可能昂贵且难以收集。


为了克服这一挑战,伦敦帝国理工学院的一组研究人员开发了一种新方法,该方法无需使用现实世界中的人类演示,即可在机器人中进行一次仿制学习。


他们的方法在arXiv上预先发表的一篇论文中提出,使用了称为任务嵌入式控制网络(TecNets)的算法,该算法允许人工代理从单个或多个演示中学习如何完成任务以及人工生成的训练数据。


研究人员在论文中写道:“我们证明,通过嵌入任务的控制网络,我们可以通过嵌入人类示范来推断控制策略,这些示范可以制定控制策略并实现一次模仿学习。”


研究人员提出的方法不需要在机器人的训练过程中与真实的人进行任何互动。该方法使用TechNet来推断控制策略,嵌入可演示给定控制策略的人工演示,并最终实现一键式模仿学习。


为了消除训练过程中对现实世界中的人类演示的需求,研究人员使用了模拟人类演示的视频数据集,这些视频是使用PyRep(最近发布的用于机器人学习研究的工具包)生成的。研究人员使用PyRep对类似人的3-D手臂进行建模,然后将其分解成各种形状,以重现类似于人类观察到的动作。


然后,他们创建了一个由视频组成的数据集,该模拟手臂在其中执行了许多任务,并用它来训练机器人系统。最终,机器人仅通过分析这些模拟视频并在现实世界中进行一次人工演示就能够学习如何完成任务。



研究人员在论文中解释说:“重要的是,我们在训练期间不使用真实的手臂来提供演示,而是在以前从未见过的应用程序中利用域随机化:在人与人之间实现从模拟到真实的传输。”


该团队在模拟和现实世界中都评估了这种新的单次学习方法,使用它来训练机器人来完成涉及放置和推动对象的任务。值得注意的是,他们的学习方法所取得的结果可与使用更传统的基于模仿学习的方法所获得的结果相提并论,尽管它需要对机器人进行人工生成的视频而非真实的人类演示进行训练。


研究人员写道:“我们能够获得与最新替代方法类似的性能,该替代方法依赖于现实世界中收集的数千个训练演示,同时还对视觉域转换(例如背景完全不同)保持了稳健。”


由这组研究人员开发的方法可以实现对多个机器人的一次性模仿学习,而无需收集大量的真实人类演示。对于那些尝试使用模仿学习来训练机器人的人来说,这可以节省大量的精力,资源和时间。研究人员现在正计划调查使用机器人的方法可以训练机器人的其他动作。


研究人员在论文中写道:“我们希望进一步研究可以从模拟转移到现实的各种人类行为。” “例如,在这项工作中,我们已经证明了可以转移人的手臂,但是同样的方法在包括人的整个躯干在内的示威活动中也会起作用吗?”


标签:行业资讯产品资讯机械应用人工智能技术中心机器人配件与装备系统及软件
免责声明: 本文仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。客服邮箱:service@cnso360.com | 客服QQ:23341571

全站地图

深圳网络警察报警平台 深圳网络警
察报警平台

公共信息安全网络监察 公共信息安
全网络监察

经营性网站备案信息 经营性网站
备案信息

中国互联网举报中心 中国互联网
举报中心

中国文明网传播文明 中国文明网
传播文明

深圳市市场监督管理局企业主体身份公示 工商网监
电子标识