就像我们一样,机器人也看不透墙。有时他们需要一些帮助才能达到目的地。
莱斯大学的工程师开发了一种方法,允许人类帮助机器人“看到”他们的环境并执行任务。
一种称为“黑暗中的贝叶斯学习”的策略鈥擝林德,简称鈥攊这是一种解决机器人长期存在的运动规划问题的新方法,机器人工作环境中并非所有东西都始终清晰可见。
这项研究由计算机科学家莉迪亚·卡夫拉基(LydiaKavraki)和瓦伊巴夫·恩赫勒卡尔(Vaibhav Unhelkar)以及联合首席作者卡洛斯·昆特罗(Carlos Quintero Pe)领导帽赖斯乔治·R·布朗工程学院的a和Constantinos Chamzas于5月下旬出席了电气和电子工程师学会机器人和自动化国际会议。
主要由Quintero Pe开发的算法帽研究表明,与Kavraki合作的两名研究生a和Chamzas让人处于“增强机器人感知,重要的是,防止执行不安全的动作”的循环中。
为此,他们将贝叶斯逆强化学习(系统通过不断更新的信息和经验进行学习)与已建立的运动规划技术相结合,以帮助具有“高自由度”的机器人鈥攖也就是说,有很多运动部件。
为了测试盲人,莱斯实验室指示一个取回机器人,一个有七个关节的关节臂,从一张桌子上抓起一个小圆柱体,并将它移到另一个桌子上,但在这样做时,它必须越过障碍物。
“如果你有更多的关节,对机器人的说明就很复杂,”昆特罗·佩恩说帽a说。“如果你在指挥一个人,你可以说,‘举起你的手。’”
但是机器人的程序员必须对其轨迹中每个点的每个关节的运动有明确的了解,尤其是当障碍物阻挡了机器对其目标的“视野”时。
BLIND没有预先编程轨迹,而是插入一个人类中间过程来优化编排选项鈥攐r最佳猜测鈥攕由机器人的算法提示。“盲人可以让我们在人脑中获取信息,并在这个高度自由的空间中计算我们的轨迹,”昆特罗·佩恩说帽a说。
他说:“我们使用一种称为“批判”的特定反馈方式,基本上是一种二元反馈形式,即在轨迹的各个部分给人贴上标签。”。
这些标签显示为连接的绿点,表示可能的路径。作为从一个点到另一个点的盲目步骤,人类批准或拒绝每个动作来优化路径,尽可能有效地避开障碍。
Chamzas说:“这是一个供人们使用的简单界面,因为我们可以说‘我喜欢这个’或‘我不喜欢那个’,机器人会利用这些信息进行规划。”。他说,一旦获得批准的一组动作,机器人就可以完成任务。
“这里最重要的一点是,人类的偏好很难用数学公式来描述,”昆特罗·佩恩说帽a说。“我们的工作通过结合人类偏好简化了人机关系。这就是我认为应用程序将从这项工作中获得最大利益的方式。”
卡夫拉基是一位机器人学先驱,他的简历中包括了美国国家航空航天局(NASA)在国际空间站上的人形机器人(Robonaut)的高级编程。他说:“这项工作很好地说明了,人工干预虽然很少,但有针对性,可以显著提高机器人在某些部分完全未知但人类已知的环境中执行复杂任务的能力。”。
“它展示了人机交互的方法(我的同事Unhelkar教授的研究课题)和我实验室多年来开创的自动化规划如何融合在一起,以提供同时尊重人类偏好的可靠解决方案。”