一匹马、斑马和人工智能帮助卡内基梅隆大学(CarnegieMellonUniversity)的一个研究小组教会机器人识别水并将水倒入玻璃杯中。
水对机器人来说是一个棘手的挑战,因为水是清澈的。机器人以前已经学会了如何倒水,但之前的技术,如加热水、使用热敏相机或将玻璃放在棋盘背景前,并不能很好地过渡到日常生活中。一个更简单的解决方案可以让机器人服务器重新装满水杯,让机器人药剂师测量和混合药物,或者让机器人园丁给植物浇水。
Gautham Narasimhan于2020年在机器人研究所获得硕士学位,他与该研究所机器人感知和操作实验室的一个团队合作,使用人工智能和图像翻译来解决这个问题。
图像转换算法使用图像集合训练人工智能将图像从一种风格转换为另一种风格,例如将照片转换为莫奈风格的绘画或使马的图像看起来像斑马。在这项研究中,该团队使用了一种称为对比学习的方法来进行未配对的图像到图像的翻译(简称CUT)。
“在学习的训练阶段,你需要某种方法来告诉算法什么是正确答案和错误答案,”机器人研究所助理教授大卫·霍尔德(DavidHold)说,他是纳拉西姆汉(Narasimhan)的顾问。“然而,标记数据可能是一个耗时的过程,尤其是在教机器人倒水时,人类可能需要在图像中标记单个水滴。”
进入马和斑马。
霍尔德说:“就像我们可以训练一个模型将马的图像转换成斑马一样,我们也可以训练一个模型将彩色液体的图像转换成透明液体的图像。”。“我们使用这个模型使机器人能够理解透明液体。”
机器人很难看到像水一样的透明液体,因为它反射、折射和吸收光线的方式因背景而异。为了教计算机如何通过一杯水看到不同的背景,研究小组在一个装满水的透明玻璃后面播放了YouTube视频。通过这种方式训练系统,无论机器人位于何处,机器人都可以在现实世界中的各种背景下浇水。
Narasimhan说:“即使对人类来说,有时也很难准确地确定水和空气之间的边界。”。
使用他们的方法,机器人能够将水倒入玻璃杯中,直到达到一定高度。然后用不同形状和大小的眼镜重复实验。
Narasimhan说,在这种方法上还有进一步研究的空间鈥攁添加不同的照明条件,挑战机器人将水从一个容器倒入另一个容器,或者不仅估计水的高度,还估计水的体积。
上个月在费城举行的IEEE机器人与自动化国际会议上介绍了这项研究。Narasimhan说,对这项工作的反应是积极的。
纳拉西姆汉(Narasimhan)目前在俄亥俄州哥伦布的路径机器人公司(Path robotics)担任计算机视觉工程师,他说:“当研究工作在现实世界中进行,而不仅仅是在模拟世界中进行时,机器人领域的人真的很欣赏这一点。”。“我们想做一些简单而有效的事情。”