一种新的方法扩展了机器人的训练数据集,使其能够像人类一样在飞行中学习,这是向机器人迈出的一步,机器人可以在绳索和织物等软物体上工作,或者在杂乱的环境中工作。
由密歇根大学机器人研究人员开发,它可以将新材料和新环境的学习时间减少到几个小时,而不是一两周。
在模拟中,扩展的训练数据集将机器人在发动机缸体上绕绳的成功率提高了40%以上,几乎是物理机器人完成类似任务成功率的两倍。
这是机器人技工需要轻松完成的任务之一。但密歇根大学机器人学副教授德米特里·贝伦森(DmitryBerenson)表示,使用今天的方法,学习如何操纵每一根不熟悉的软管或皮带,需要大量的数据,可能需要数天或数周的时间才能收集到,他是今天在《机器人学:纽约市的科学与系统》上发表的一篇论文的资深作者。
在这段时间里,机器人会摆弄软管鈥攕抽搐它,把两端连在一起,绕过障碍物等等鈥攗直到它了解软管可以移动的所有方式。
贝伦森说:“如果机器人需要在安装软管之前玩很长一段时间,这在很多应用中都是行不通的。”。
事实上,如果机器人的同事需要这样的时间,人类力学可能不会给他留下深刻印象。因此,贝伦森和机器人学博士彼得·米特拉诺对一种优化算法进行了改进,使计算机能够做出我们人类所做的一些概括鈥攑预测在一个实例中观察到的动力学如何在其他实例中重复。
在一个例子中,机器人在拥挤的表面上推动圆柱体。在某些情况下,圆柱体没有撞到任何东西,而在另一些情况下,圆柱体与其他圆柱体碰撞,它们也随之移动。
如果圆柱体没有碰到任何物体,那么这种运动可能会在桌子上的任何地方重复,在那里,轨迹不会把它带到其他圆柱体中。这对人类来说很直观,但机器人需要获取这些数据。Mitrano和Berenson的程序不需要进行耗时的实验,而是可以对第一次实验的结果进行修改,以同样的方式为机器人服务。
他们专注于制造数据的三个方面。它必须具有相关性、多样性和有效性。例如,如果你只关心机器人在桌子上移动圆柱体,那么地板上的数据就不相关了。另一方面,数据必须多样化鈥攁表格的所有部分,必须探索所有角度。
米特拉诺说:“如果你最大限度地扩大数据的多样性,它就没有足够的相关性。但如果你最大限度地扩大相关性,它就没有足够的多样性。”。“两者都很重要。”
最后,数据必须有效。例如,任何有两个圆柱体占据相同空间的模拟都是无效的,需要将其标识为无效,以便机器人知道不会发生这种情况。
对于绳索模拟和实验,Mitrano和Berenson通过将绳索的位置外推到物理空间虚拟版本中的其他位置来扩展数据集鈥攕o只要绳子的行为与最初的情况相同。仅使用初始训练数据,模拟机器人在48%的时间内将绳索钩住发动机缸体。在对扩充数据集进行训练后,机器人成功了70%。
一项用真实机器人探索飞行学习的实验表明,让机器人以这种方式扩展每次尝试,在30次尝试的过程中,成功率几乎翻了一番,13次而不是7次。