协助机器人通常是移动机器人,设计用于在商场、机场、医疗保健设施、家庭环境和各种其他环境中协助人类。除其他外,这些机器人可以帮助用户在未知环境中找到自己的路,例如引导他们到特定位置或与他们共享重要信息。
虽然辅助机器人的能力在过去十年中有了显著提高,但迄今为止在现实环境中实现的系统尚不能在拥挤的空间中有效地跟踪或引导人类。事实上,训练机器人在以许多随机移动的“障碍物”为特征的动态环境中导航时跟踪特定用户远非一项简单的任务。
柏林理工学院(Berlin Institute of Technology)的研究人员最近推出了一种基于深度强化学习的新模型,该模型允许移动机器人在拥挤的环境中引导特定用户到所需的位置,或在携带物品时跟随他/她四处走动。该模型在arXiv上预先发布的一篇论文中介绍,可以帮助显著提高商场、机场和其他公共场所机器人的能力。
“在拥挤的环境中,如机场或火车站,引导或跟随人类搬运重量或货物的任务仍然是一个悬而未决的问题,”林说盲斯特纳、巴塞尔·法特伦、申正成、丹尼尔·加瑞希和延斯·兰布雷希特在他们的论文中写道。“在这些用例中,机器人不仅需要与人类智能交互,还需要在人群中安全导航。”
在训练模型时,研究人员还包括了关于人类用户状态和行为的语义信息(例如,说话、跑步等)。这使得他们的模型能够决定如何最好地帮助用户,以类似的速度与用户并排移动,并且不会与其他人或附近的障碍物发生碰撞。
研究人员在论文中写道:“我们提出了一种基于深度强化学习的智能体,用于拥挤环境中的人类引导和跟踪任务。”。“因此,我们结合语义信息,为代理提供高级信息,如人类的社会状态、安全模型和类类型。”
为了测试他们的模型的有效性,研究人员使用arena rosnav进行了一系列测试,arena rosnav是一个用于训练和评估深度学习模型的二维(2D)模拟环境。这些测试的结果很有希望,因为模拟场景中的人工智能体可以引导人类到达特定位置并跟随它们,将其速度调整为用户的速度,并避开附近的障碍物。
研究人员在论文中写道:“我们将提出的方法与没有语义信息的基准方法进行了比较,并证明了增强的导航安全性和鲁棒性。”。“此外,我们还证明了智能体可以学习使其行为适应人类,这显著改善了人机交互。”
该研究团队开发的深度强化学习模型在模拟中表现良好,因此其性能现在需要在真实环境中使用物理机器人进行验证。在未来,这项工作可能为在机场、火车站和其他拥挤的公共场所创造更高效的机器人助手铺平道路。
漏 2022年科学X网络