一辆小型无人机在一个空旷的地方进行试飞,里面装满了随意放置的纸板筒,它们充当树木,人或建筑物的替身。控制无人机的算法已在一千个模拟的载满障碍的路线上进行了训练,但从未见过这样的路线。仍然,十分之九的飞机,缩小了大小,这架飞机躲避了其路径上的所有障碍中国机械网okmao.com。

该实验为现代机器人技术中的关键挑战提供了试验平台:保证在新型环境中运行的自动化机器人的安全性和成功的能力。随着工程师越来越多地使用机器学习方法来开发适应性强的机器人,普林斯顿大学研究人员的新工作在各种障碍和约束条件下为机器人提供此类保证方面取得了进展。
“在过去的十年左右的时间里,围绕机器人技术在机器学习方面获得了大量的兴奋和进步,主要是因为它允许您处理丰富的感官输入,例如来自机器人相机的感觉输入,并映射这些复杂的输入普林斯顿大学机械与航空航天工程学助理教授阿尼鲁达(Anirudha Majumdar)说,要采取行动。
但是,基于机器学习的机器人控制算法存在过拟合其训练数据的风险,这可能会使算法在遇到与训练时输入不同的输入时效率降低。Majumdar的智能机器人运动实验室通过扩展用于训练机器人控制策略的可用工具套件,并量化了在新颖环境中执行机器人的可能成功和安全性,解决了这一挑战。
在三篇新论文中,研究人员将其他领域的机器学习框架应用于机器人运动和操纵领域。他们转向一般化理论,该理论通常用于将单个输入映射到单个输出的上下文中,例如自动图像标记。新方法是最早将泛化理论应用于更复杂的任务的方法之一,以确保在陌生环境下机器人的性能。Majumdar说,虽然其他方法在更严格的假设下提供了此类保证,但该团队的方法为新颖环境中的性能提供了更广泛适用的保证。
在第一篇论文中,该团队证明了应用机器学习框架的原理,并在模拟中测试了他们的方法,其中包括轮式车辆行驶在充满障碍物的空间中,以及机械臂抓住桌子上的物体。他们还通过评估一种称为“鹦鹉秋千”(组合式四旋翼飞机和固定翼飞机)的小型无人机在飞越60英尺长的长满纸板筒的走廊上的避障情况来验证该技术的有效性。无人机控制策略的保证成功率为88.4%,并且在20项试验中的18项(90%)中避免了障碍。
该研究成果由Majumdar合着,于10月3日发表在《国际机器人研究杂志》上。亚历克·法里德(Alec Farid),机械和航空航天工程专业的研究生;以及普林斯顿大学2021年级计算机科学专业讲师Anoopkumar Sonar。
Farid说,在将其他领域的机器学习技术应用于机器人技术时,“您需要满足许多特殊的假设,其中之一是说您希望看到的环境与您的政策所处的环境有多么相似。除了证明我们可以在机器人环境中做到这一点之外,我们还集中精力尝试扩大可以提供保证的环境类型。”
“根据具体任务,我们能够在新环境中提供大约80%到95%的成功率,但是如果您要在真实环境中部署[无人驾驶飞机],那么95 %可能还不够好,” Majumdar说。“我认为这是最大的挑战之一,也是我们正在积极努力的挑战。”
加利福尼亚洛斯阿尔托斯市丰田研究所高级研究科学家戴宏开说,尽管如此,该团队的方法仍代表了在看不见的环境中运行的机器人在通用保证方面急需的进展。
没有参加这项研究的戴说:“这些保证对于许多安全性至关重要的应用至关重要,例如无人驾驶汽车和无人驾驶飞机,在这些应用中,训练集无法涵盖所有??可能的情况。” “保证书告诉我们,在看不见的情况下,一项政策仍然有可能表现得相当不错,从而在失败的风险过高的情况下,对该政策树立了信心。”
在将于11月18日在虚拟机器人学习大会上发表的其他两篇论文中,研究人员研究了其他改进方案,以使机器人控制策略更接近于实际部署所需的保证。一篇论文使用了模仿学习,其中人类的“专家”通过手动引导模拟机器人拾取各种物体或在有障碍物的不同空间中移动来提供训练数据。这种方法可以提高基于机器学习的控制策略的成功率。
为了提供培训数据,机械和航空航天工程专业的研究生艾伦·雷恩(Allen Ren)使用3D电脑鼠标来控制模拟的机械臂,该机械臂负责抓握和提起各种尺寸,形状和材料的水杯。其他模仿学习实验包括用手臂将盒子推过桌子,以及模拟轮式机器人在类似居家环境中的家具周围漫游的实验。
研究人员将从抓杯子和推箱子的任务中学到的策略部署到实验室的机械臂上,该机器手臂通过抓住两个手指状抓手之间的边缘来捡起25个不同的杯子-不用握住手柄就像人类一样 在推箱子的例子中,该策略在较轻松的任务上获得了93%的成功,在较困难的任务上获得了80%的成功。
任志刚说:“我们在桌子上方有一台摄像头,可以看到环境,并每秒拍摄五次照片。” “我们的政策培训模拟将捕获此图像,并输出机器人应采取的动作,然后我们有一个控制器,可根据模型的输出将手臂移动到所需位置。”
第三篇论文展示了基于视觉的计划器的开发,该计划器为飞行或行走的机器人在各种环境中执行计划的运动顺序提供了保证。为计划中的运动生成控制策略带来了一个新的规模问题-需要优化具有数千个而非数百个维度的基于视觉的策略。
机械和航空航天工程的博士后研究主要作者Sushant Veer说:“这需要提出一些新的算法工具,以便能够解决该维数问题,并且仍然能够提供强大的泛化保证。”
Veer策略的一个关键方面是运动原语的使用,在运动原语中,例如,一条策略指示机器人直行或转弯,而不是为每个运动指定扭矩或速度。Majumdar说,缩小可能采取的行动的空间使计划过程在计算上更加易于处理。
Veer和Majumdar评估了基于视觉的规划师,他们模拟了无人驾驶飞机绕过障碍物和四足机器人穿越坡度高达35度的崎terrain地形-“这是一个非常具有挑战性的问题,许多机器人技术人员仍在尝试解决。”
在这项研究中,有腿机器人在看不见的测试环境中获得了80%的成功率。研究人员正在努力进一步改善其策略的保证,并在实验室中的真实机器人上评估策略的性能。
这项工作得到了美国海军研究办公室,美国国家科学基金会,谷歌院系研究奖和亚马逊研究奖的部分支持。