当前位置: 首页 > 资讯

【原创】3D图像数据库——让你的机器人更懂"家"

机器人网       2017-05-01

目前,大多数家庭服务机器人之所以很难真正帮助人们干家务活,主要是因为机器人想要完成一个简单的任务,都必须要得到非常明确的指示,例如:咖啡桌和婴儿床有什么区别等。

斯坦福大学、普林斯顿大学和慕尼黑工业大学的研究人员共同开发的大型3D图像数据库有望解决这一难题。这个图像数据库被称为ScanNet,包含了成千上万个由数以百万计分段注释的物体(例如咖啡桌、沙发、灯和电视)构成的3D视图。在过去五年中,计算机视觉成像技术之所以大为提升,部分原因是由于斯坦福大学的另一个研究小组发布了一套更加简单实用的二维图像数据库,这套数据集被命名为“ImageNet”,主要被用来标记图像。

3D图像数据库研究人员之一的慕尼黑工业大学教授Matthias Neissner说:”ImageNet有着非常重要和庞大的图像注释数据,这可能会引发一场人工智能革命。”

ScanNet的出现给了机器能够更好认识周围环境并且具有更多实际应用的希望。Neissner说:”如果你想要让家中的机器人帮你干活,那么首先你得让它清楚地认识周围的环境。”

在斯坦福大学做访问学者期间,Neissner认为深度学习(ImageNet中用到的类似的机器学习技术)可以被应用于计算机,让其更好的了解三维视图。Neissner、Angela Dai(Neissne在斯坦福大学的学生)、普林斯顿大学的教授Thomas Funkhouser以及他的其他几个学生共同创建了这个3D图像数据库。

在最近发表在网上的一篇学术论文中,研究人员介绍了一种新的关于构建3D图像数据库的方法,他们用3D摄像机(类似于微软Kinect)扫描了1513个场景来收集数据,构建了一个数据集。该设备同时使用了传统摄像机和红外深度传感器,在前面创建出一个三维场景。随后,研究人用iPad登录亚马逊的Mechanical Turk网络交易平台,雇佣了一些志愿者为场景做了注释。为了提高整体精度,一组志愿者负责在扫描过程中绘制和标记对象,另一组则负责用3D模型重新创建一个场景。

布朗大学的助理教授Stefanie Tellex正在做有关家用服务机器人的研究。她认为ScanNet要比现有的任何数据库都大得多。她说:”3D信息对于机器人的环境交互感知是至关重要的,缺乏数据是当前全球研究人员们遇到的一大难题,因此构建出一个数量级巨大的数据集是一个非常伟大的贡献。”

Neissner谈到,在尝试了应用了3D数据集深度学习后,机器人仅仅通过深度信息或者物体的形状就可以辨别许多物体。这预示着3D数据可以被用来更深入的了解现实世界。同时,他还说使用3D数据信息可以帮助机器人更好地模仿动物感知事物的方式。

卡内基梅隆大学机器人研究所教授Siddhartha Srinivasa表示,新的3D数据集可能会成为使机器真正了解家庭环境的“良好开端”。Srinivasa说:"ImageNet的普及,部分原因是该数据库的数据量庞大,但是更主要是因为图像标记在生活中,尤其是在Web应用程序中的广泛应用。"目前除了机器人和建筑领域外,3D数据库还没在其他行业中得到广泛应用,但是这种局面很快将会被打破。

Srinivasa补充说,使用合成或者虚拟的视图可以训练机器视觉系统。"通过观看电影特效我们可以发现,虽然电影特效在模拟现实图像这点上差强人意,但是在模拟景深这点上,它表现得还是极为真实的。"

关键词:机器人