机器人可以在现实世界的障碍物轨道上自主导航
佐治亚理工学院和斯坦福大学的研究人员最近开发了AlienGo,这是一种四足机器人,可以遵循公共地图服务生成的特定路线,同时保持在人行道上并避免与障碍物或人类发生碰撞。这个机器人在arXiv上预先发表的一篇论文中提出,它基于一个新的、高性能的两阶段学习框架,可用于安全人行道导航。
研究人员表示:“作为项目的一部分,我们开发了一种智能四足机器人,可以在现实世界中的人行道上导航,我们的工作受到现有工作的两个分支的启发:自动驾驶和室内机器人导航。然而,由于室外人行道导航通常发生在没有任何引导车道的各种行人和障碍物的非结构化环境中,我们还提出了一套学习技术和算法来解决这些特定的挑战。”
最初,该团队训练了一个人工神经网络,以在模拟中导航简单的人行道环境。第一个被称为“专家”的算法是使用高速显著世界模拟器进行训练的,并且可以访问模拟的所谓“特权状态”。随后,这个“专家”网络在高保真模拟中将它学到的行为转移到“学生”算法中。最终,这个“学生”网络产生了逼真的传感器观察结果,类似于现实世界的人行道图像。
“学生”使用自定义训练的语义特征网络生成抽象,随后用于控制机器人,这种方法基于研究人员的经验,即使用幼稚的端到端训练很难获得所需的行为,仅仅是因为问题太难了。
使用研究人员开发的两阶段学习框架,他们能够在模拟中使用“特权”信息获得有效的策略,然后将框架获得的行为转移到真正的四足机器人上。当团队评估该框架后,他们发现它在人行道导航方面的性能优于其他最先进的模型。然后,他们还在真实环境中测试了他们的框架,将其应用于在亚特兰大的人行道上导航的 AlienGo 机器人。
除了在抽象世界中使用两阶段学习带来的性能提升之外,令人惊讶的是,通过研发的数据增强/数据管理转移到现实世界是多么容易,鉴于在训练期间机器人从未见过任何真实世界的人行道图像,并且考虑到现实世界的所有复杂性,至少可以说,没有任何适应的表现是值得注意的。这一发现可能意味着最近的许多工作机器人学习可以转移到现实世界,并有望实际用于造福人类。
未来,这组研究人员开发的四足机器人可用于完成各种任务,例如递送包裹或监测城市环境。此外,他们开发的框架可以应用于其他现有或新兴的移动机器人,以提高他们在人行道上移动导航的能力。
虽然研究人员在导航的模拟到真实转移方面取得了很大进展,但仍然存在许多挑战,这仍然需要克服与导航相关的一些挑战,包括过马路、动态障碍物处理以及与现实世界物体和人类的交互,但是,我们的方法不仅限于导航,它还可能应用于许多机器人应用,例如操纵、运动等。