当前位置: 首页 > 资讯

【重磅】2016 深度学习机器人领域最新应用及趋势总结

       2016-08-13

过去3年,深度学习在计算机视觉领域取得了巨大成功。其中,在物体识别和检测、场景分类、根据图像生成文字描述等领域表现尤为突出。不过,深度学习在机器人视觉领域的表现还相形见绌。

  虽然深度学习在机器人根据视觉引导进行抓取和控制方面得到了很好的应用,但目前还没有在机器人领域成为主流。而且,在去年的RSS、ICRA等重大国际机器人会议上,很多著名的研究者对深度学习技术在机器人场景中的应用能力公开提出了质疑。

  因此,本届RSS2016,主办方特地举办了一场小型研讨会,探讨深度学习在机器人技术中的应用及局限(Are the Sceptics Right? Limit sand Potential sofDeep Learning in Robotics)。虽然只是一个小型研讨会(workshop),但主办方也邀请到机器人技术、深度学习和计算机视觉领域三方面的专家。其中,有的是在深度学习技术出现后很快就将其应用于自己在机器人技术相关领域,也有著名的“深度学习怀疑论者”。

  下文作者是伦敦帝国理工大学戴森机器人实验室博士生John McCormac。McCormac的导师Andrew Davison是伦敦帝国理工大学计算机系主任,领导该校机器人视觉研究小组,同时也是戴森机器人实验室的负责人。McCormac的研究方向是使用深度学习进行三维语义分割和场景理解。

  最后,Pieter Abbeel直接问“谁是深度学习怀疑论者”,现场参加讨论的150到200多人中,包括听众和讲者,只有大约5到10人举起了手。而且,这些怀疑论者在被问道时,还都对深度学习表示了肯定,认为这种技术是研究机器人的重要工具之一。

  让人对深度学习产生怀疑的大致有两点:一是在一些特定情境下无法确保做出规定动作,二则是深度学习在很多方面缺乏可解释的不确定性测量手段。


  LarryJackel提出了衡量一个人是否是“深度学习怀疑论者”的标准:按正常情况预计,未来10年自己会不会使用神经网络。如果你的答案是“不会”,那么你就属于深度学习怀疑论者阵营。

  在OliverBrock逼问之下,Pieter给出了一个更宽泛的解释,称深度学习提供了一个工具包,机器人技术研究者有望利用这个工具包实现更通用的智能机器人。有人表示如今对深度学习热潮有可能是寒冬降临前的爆发,但Pieter认为这不大可能发生,鉴于很多大公司已经使用深度学习盈利,比如谷歌的广告系统。

  与会者普遍对深度学习采取实用的态度:机器人技术研究者要做的,是提出先验约束和模型约束,而深度学习则是之后再去解决这些约束造成的问题。

OliverBrock将机器人技术里的深度学习现状和炼金术相比,每个人都有自己设计架构的黑魔法,而这是一个值得全领域从业者注意的问题。Brock呼吁要建立起机器人技术的“元素周期表”,研究者应该注意并且在论文中强调自己使用的方法对解决其他领域问题的适用性。

  Ashutosh Saxena的观点是,机器人应用场景中的深度学习问题就像一个因子图,每个因子都是一个经过训练的RNN。Saxena认为,形成这样一个主因子图结构,同一个机器人不同时间的子任务和不同机器人之间就都能共享组件



  Dieter Fox主张将深度框架和先验模型相结合。Fox表示他以前对深度学习抱有怀疑,但如今已经是深度学习的积极拥护者,其原因是深度学习技术在机械手的姿态估计中的鲁棒性。Fox表示,纯粹基于模型的方法虽然能得到明确的置信区间,但在实际应用中很难达到这一点。他以ICP要求为例,至少用CNN做单帧手势跟踪鲁棒性非常好。



  John Leonard一开始说自己是深度学习怀疑论者,但5个月前他看到了LarryJackel做的英伟达自动驾驶有关项目,然后改变态度,认为“让那些不用深度学习的人自生自灭就好了”。Jackel使用的是特斯拉收集的数据,包含摄像头和传感器记录的上亿英里的驾驶训练数据。Leonard还介绍了深度学习在机器人传统概率推理中的应用及未来潜力。

训练数据都从哪里来??

  很多讲者都提到了训练数据的问题。Pieter Abbeel强调了OpenAIGym平台可以用于解决合成强化学习机器人问题。

  很多人都采用这样的方法:先在合成数据库上做试验,之后再使用现实世界数据进行更复杂的模拟。

  谷歌DeepMind的RaiaHadsell在演讲中提到了PNN非常适用于这一过程。最先是训练系统玩ATARI游戏,然后发展成模拟的三维机械臂控制问题,结果发现使用了预先训练过的PNN框架的系统学得更快、性能更好。





  DieterFox的实验室也采取了类似的方法。他们为流体模拟时,先使用混合的流体模拟,然后再使用现实世界的数据。




尚待解决的DL问题

  一个经常提到的问题是如何将训练后的深度学习系统整合进应用于现实世界的机器人产品,不论是家用机器人还是自动驾驶汽车。绝大部分讲者认为,将测试中的每一个可能情形列举出来是不可能的,因此必须设定一些标准的故障容差数据集。Scheirer将容差与工厂里依靠统计模型进行测试作类比。NicholasRoy则认为基于模型的方法更好。

  WalterScheirer从数据的角度讨论了CNN鲁棒性低的问题。CNN显然适用于单个图像分类任务,但鲁棒性低有时候确实是个问题。Scheirer借用心理物理学(Psychophysics)评价神经网络的方式,测试识别模糊图像和遮挡问题。结果得到了很多性能一流的网络,结果分辨率用人眼看也没有什么显著降低。因此,Scheirer指出,CNN在图像识别方面性能“超人”,但应用起来表现不好,实际上是参数没有设置好,导致算法鲁棒性评估出了问题。

  在讨论中还出现了很多有趣的问答。有人问我们用人类使用的数据训练机器,这样的机器是否能够拥有超过人的能力,OliverBrock回答说“AlphaGo”。另一个则是研究中在线训练时间的问题,有人问网络线下训练的权重是否重要时,Raia回答说“是”。不过她之后具体阐述了这个问题,也是谷歌DeepMind在强化学习研究中的核心问题。

  总结

  最后,Pieter说相比以前,人脑也没有得到很明显的进化,但除了吃喝,我们还从中“得出”了很多充满智慧的发展。这也表明深度学习在机器人领域还仅仅处于起步阶段,而将来深度学习在机器人领域中的应用对发展通用人工智能大有助益。


关键词:机器人