密歇根大学的研究人员迈出了一种可以快速导航无法预测和混乱的空间的家庭机器人的步骤,该算法可以使机器感知环境的速度比以前的类似方法快几个数量级。

“机器人知觉是提供可以部署到人们家中的功能强大的辅助机器人的最大瓶颈之一,”计算机科学与工程专业的研究生,《科学机器人》上发表的论文的主要作者卡尔西克·戴辛(Karthik Desingh)说。
“在有结构的工业环境中,机器人可以很快完成诸如制造汽车之类的任务中国机械网okmao.com。但是我们生活在非结构化的环境中,我们希望机器人能够处理我们的混乱情况。”
从历史上看,机器人在护栏或笼子后面的结构化环境中可最有效地运行,以确保人员安全,并使机器人的工作区清洁有序。但是,在工作或家庭中,人的环境通常是各种状态的杂物:键盘上的文件,藏有汽车钥匙的袋子或藏有半开橱柜的围裙。
团队的新算法称为“用于非参数置信度传播的请求消息传递”。在10分钟内,它可以计算出对物体姿势(或位置和方向)的准确理解,其精确度达到以前的方法需要一个半小时以上。
团队使用Fetch机器人演示了这一点。他们证明了他们的算法可以正确地感知和使用一组抽屉,即使用毯子覆盖了一半,当抽屉半开时,或者机器人的手臂本身隐藏了抽屉的完整传感器视图时,也是如此。
该算法还可以从简单的修整器扩展到具有多个复杂关节的对象。他们表明,机器人可以准确地感知自己的身体和抓臂。
“我们算法背后的概念,例如非参数信念传播,已经在计算机视觉中使用,并且在捕获我们世界的不确定性方面表现非常出色。
但是这些模型在机器人技术方面的影响有限,因为它们的计算成本很高,需要更多时间计算机交互科学和工程学教授,密歇根州机器人研究所的核心教员查德·詹金斯说:
先前的技术依赖于“推送消息传递”
非参数信念传播技术与类似的粒子消息传递技术于2003年首次发布。它们在计算机视觉中非常有效,它试图通过图像和视频来全面了解场景。这是因为与机器人感知中涉及的三维场景相比,二维图像或视频所需的计算能力和时间更少。
这些较早的方法通过将场景转换成节点和边缘的图形模型来理解场景,这些节点和边缘表示对象的每个组件以及它们之间的关系。然后,算法在给定一组约束的情况下假设(或建立)零部件的位置和方向。研究人员称这些信念为粒子,它们在各种概率范围内变化。
为了缩小最可能的位置和方向,这些组件利用“推送消息传递”在节点之间和向后发送可能的位置信息。然后将该位置信息与传感器数据进行比较。此过程需要进行多次迭代才能最终获得对场景的准确把握。
例如,给定一个带有三个抽屉的梳妆台,对象的每个组件(在这种情况下,每个抽屉和梳妆台本身)都将是一个节点。约束条件是抽屉必须在梳妆台内,并且抽屉可横向移动但不能垂直移动。
将节点之间传递的信息与来自传感器的真实观测值进行比较,例如2-D图像和3-D点云。通过迭代重复消息,直到信念和传感器数据之间达成一致为止。
新算法转向“拉消息”
为了简化对计算的需求,Desingh和密歇根州的团队利用了所谓的“拉式消息传递”。他们的方法将来回的,信息密集的消息变成了对象组件之间的简洁对话。
在该示例中,代替仅在从其他抽屉计算了信息之后梳妆台才将位置信息发送到抽屉,而是梳妆台首先与抽屉核对。
它要求每个抽屉对自己的位置有自己的把握,然后为了准确性,将其与其他抽屉的信息进行权衡。就像推送方法一样,它通过迭代收敛对场景的准确理解。
为了直接将他们的新方法与以前的方法进行比较,他们在一个简单的二维场景中对其进行了测试,该场景的四个矩形臂隐藏在相似的圆形和矩形的图案中。
以前的方法每次迭代需要20多分钟的处理时间才能传递消息,而该团队的新方法只用了不到两分钟的时间,并且随着信念或粒子数量的增加,这种改进呈指数级加快。
在这些试验中,他们的新算法进行了五次迭代,以实现抽屉和梳妆台位置估计的平均误差小于3.5英寸,或者当梳妆台被部分遮盖住时,位置估计的平均误差小于8英寸。毯。
这与以前的方法相当,并且根据对象的大小,零件数量以及传感器可见的数量而有所不同。最重要的是,准确性的提高足以使机器人通过连续迭代成功地操纵对象。
Desingh说:“这仅仅是我们在机器人感知中进行信念传播的开始。” “我们希望将我们的工作扩大到多个对象,并在动作执行期间跟踪它们,即使机器人当前不在看物体。然后,机器人也可以使用此功能持续观察世界,以进行面向目标的操纵和成功完成任务。”