当前位置: 首页 > 资讯

【重磅报告】服务机器人核心技术与模块解析(下)

机器人网       2016-08-03



  三、交互模块:语音达商用门槛,语义理解亟待提升

  1 智能语音技术已经达到商用门槛

  语音语义发展历经三阶段,规则阶段进展甚微,统计阶段第一次爆发,深度学习是第二次爆发。20世纪50年代到70年代,在语音识别领域由规则主导,瓶颈无法破除发展缓慢,IBM几百个词70%的识别度;20世纪70年代到20世纪末,发展迅速,统计与规则角力,并逐步解决语音识别、词性分析、句法分析问题;21世纪初,由于计算能力增强语音技术有了重大突破,2006年至今,深度学习继续在语音识别领域完善。

 

  2 语义理解仍需时日,静待深度学习算法突破

  自然语言处理(NLP):词法和句法基本解决,语义目前仅是浅层处理。NLP分析技术大致分为三个层面:词法分析、句法分析和语义分析。

  1)词法分析

  词法分析包括分词、词性标注、命名实体识别和词义消歧。分词和词性标注好理解。命名实体识别的任务是识别句子中的人名、地名和机构名称等等命名实体。每一个命名实体都是由一个或多个词语构成的。词义消歧是要根据句子上下文语境来判断出每一个或某些词语的真实意思。

  2)句法分析

  句法分析是将输入句子从序列形式变成树状结构,从而可以捕捉到句子内部词语之间的搭配或者修饰关系,这一步是NLP中关键的一步。目前研究界存在两种主流的句法分析方法:短语结构句法体系,依存结构句法体系。其中依存关系句法体系现在已经成为研究句法分析的热点。依存语法表示形式简洁,易于理解和标注,其可以很容易的表示词语之间的语义关系,比如句子成分之间可以构成施事,受事,时间等关系。这种语义关系可以很方便的应用鱼语义分析和信息抽取等方面。依存关系还可以更高效的实现解码算法。句法分析得到的句法结构可以帮助上层的语义分析,以及一些应用,例如机器翻译、问答、文本挖掘、信息检索等。

  3)语义分析

  语义分析的最终目的是理解句子表达的真实语义。但是用什么形式来表示语义一直没有能够很好的解决。语义角色标注是比较成熟的浅层语义分析技术。给定句子中的一个谓词,语义角色标注的任务就是从句子中标注出这个谓词的施事、受事、时间、地点等参数。语义角色标注一般都在句法分析的基础上完成,句法结构对于语义角色标注的性能至关重要。




  自然语言处理难点:词义消歧是瓶颈,中文相对英文更难。之一:切词,中英文自然语言处理都有一个先行环节,就是把输入的字符串分解成为词汇单位;之二:词类标注;之三:语法理论;之四:词义消歧。




  自然语言处理未来的解决方式:深度学习。自然语言处理未来将依靠深度学习,具体在三个方面:词嵌入、基础模型、应用。这一部分的解决方式与图像识别类似,具体内容将在下面图像识别处继续说明。




  3 图像识别对语音语义交互领域形成补充

  图像识别系统的过程分为五部分:图像输入、预处理、特征提取、分类和匹配。人类感觉信息中的80%都是视觉信息。图像识别是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。简单来说,图像识别就是计算机如何像人一样读懂图片的内容。借助图像识别技术,我们不仅可以通过图片搜索更快的获取信息,还可以产生一种新的与外部世界交互的方式,甚至会让外部世界更加智能的运行。




  图像识别的应用领域非常广泛。从工业视觉到人机交互,从视觉导航到虚拟现实,从安全领域到医学图像,从自动解释道遥感分析,这些在未来服务机器人身体上都是非常重要的功能。




  印刷/手写字体OCR识别技术早已成熟,自然条件下OCR技术在十年前是难题。20世纪90年代,平板扫描仪对印刷体文本的识别率已经达到99%以上,谷歌还申请了图书扫描专利,除此之外手写字体的识别也被广泛用于邮件分类、支票分类、手写表格数字化等领域。但是在2004年300万像素的智能手机诞生后,人们发现手机拍摄的自然条件下的文字识别率大大降低,即使是印刷字体也只能达到60%-70%的识别率。




  近年来自然条件下OCR识别率不断提高,微软取得突破性进展。经过技术不断突破,业界识别精度达到80%,召回率达到67%。在2014年8月斯德哥尔摩举办的国际模式识别大会(ICPR)上,微软亚洲研究院团队将自然条件下文字识别精度提升到92.12%,召回率提升至92.32%,基本达到商用门槛值。




  图像识别准确率不断提高,但是仍无法满足商用要求。ImageNet图像分类大赛:以计算机视觉领域“奥林匹克竞赛”之称的ImageNet对象分类为基准。比赛设置:1000类图像分类问题,训练数据集126万张图像,验证集5万张,测试集10万张。2012,2013,2014均采用了该数据集。评价标准采用top-5错误率,即对一张图像预测5个类别,只要有一个和人工标注类别相同就算对,否则算错。近年来识别准确率不断提高,但仍在自然条件下表现不好,仍无法满足商用要求。




  未来图像识别门槛值突破将依靠深度学习。图像识别技术并不完善,仍然面临许多困难。图像识别的问题,目前是学术界研究的热点,这类AI问题将从三个方面去着手解决:首先是计算能力,通过CPU、GPU、分布式架构等提高计算能力,然后是大数据,数据量越多,一般来说越有利于机器学习,还有算法,目前主流的算法是深度学习的CNN算法和RNN算法。

  四、运控模块:步态与非步态,不是替代,而是共生

  1 液压已突破瓶颈,电机控制有待提升

  服务机器人运动的控制,有液压控制和电机控制两种方式。Alphabet的子公司BostonDynamics研发的Atlas是液压控制的典型代表,2016年2月,其利用3D打印技术将液压元件嵌入身体,通过液压控制采用力矩控制的算法,实现了雪地行走和摔倒爬起等动作,技术复杂但是非常成功。而本田公司的Asimo采用经典的ZMP算法,自2000年来第一次亮相至今,经过不断发展已经实现了基本的弯腰、握手、跳舞等功能,但是在控制精度和稳定性方面仍然有待提高。虽然如此,因为液压控制的体积大等原因,在军事应用方面前景较好,但是在家庭应用领域,电机控制将是主流。




  步态行走侧重于精准控制,非步态行走主要是简单移动。从外观来看,服务机器人的行走方式有两种,步态和非步态。步态行走包括液压控制和电机控制,在电机控制中,在关节的位置处,有一种典型的舵机,因其精巧的体积和合适的扭矩非常适合用在服务机器人的关节处控制,同时舵机也是机器人硬件的主要成本之一,典型的带有舵机的机器人:国外是Nao机器人、Asimo机器人和Atlas等,国内典型是优必选;非步态行走主要是电机控制,结构较为简单,主要是在机器人底部装上万向轮,供其简单移动,一般的万向轮成本很低,只有几十元,非步态的典型机器人代表是:国外是Pepper,国内是康力优蓝。




  2 运控模块中,舵机是核心部件

  舵机是步态服务机器人的核心部件,舵机对价格十分敏感。舵机也叫伺服电机,包含了电机、传感器和控制器,是一个简单而完整的伺服电机系统。最早用于船舶上实现其转向功能,由于可以通过程序连续控制其转角,可以得到比较精准的位置、速度或力矩输出,因而广泛用于机器人各类关节运动中。步态机器人自由度(关节数)众多,优必选Alpha1S有16个自由度,本田Asimo第三代有57个自由度,步态机器人对舵机价格十分敏感。




  目前在服务机器人舵机领域,最流行的品牌是韩国Robotis的Dynamixel系列。舵机功率(角速度X扭矩)相同时,角速度与扭矩成反比。舵机的功率和舵机的尺寸比值可以理解为该舵机的功率密度,一般同样品牌的舵机,功率密度大的价格高。对于服务机器人舵机的核心参数扭矩更是如此,随扭矩增加,价格增长飞快。比如Dynamixel系列中,扭矩12kg?cm的价格约400元,扭矩28kg?cm价格约2000元,扭矩106kg/cm价格约4000元。




  国外舵机价格昂贵,国内优必选公司突破技术壁垒降低成本。优必选开发的舵机内置MCU系统,自主改进PID算法,扭矩大,体积小,控制精度高,获得多项发明专利。6.5V时扭矩为8kg?cm,速度为0.238sec/60°,价格约20元,参数相似的舵机,特别是扭矩相似的国外产品,价格往往在优必选舵机的3倍以上。




  五、其他模块:AI智能芯片与机器人操作系统

  1 AI智能芯片:通用与专用并行,各司其职

  通用芯片向深度神经网络方向发展如火如荼。传统的CPU是计算机的核心,在图形处理和深度神经网络的计算上,GPU表现出更强的性能,而2015年Intel收购Altera的主要产品FPGA即现场可编程门阵列性能更加优异,中端FPGA能够实现375GFLOPS的性能,功耗仅为10-20W,和CPU和GPU相比,FPGA在深度神经网络(DNN)预测系统中性能更加出色。DNN系统用于语言识别、图像搜索、OCR、面部识别、网页搜索以及自然语言处理等各种不同应用。相同功率时,在32线程下,FPGA的速度/功耗比约为CPU的42倍,约为GPU的25倍。




  专用芯片以智能算法和仿生两条主线并行。专用芯片又称为“人工智能芯片”“神经网络芯片”等,目前专用芯片有两种思路:以智能算法为主线和以仿生为主线,两者的典型代表分别为寒武纪、IBMTureNorth。寒武纪1号的主频可以达到0.98GHz,处理速度相当于同等面积下CPU的100倍。即便与最先进的GPU相比,寒武纪1号的人工神经网络处理速度也不落下风,而其面积和功耗远低于GPU的1/100。IBM在复杂性和使用性方面取得了突破。4096个内核,100万个“神经元”、2.56亿个“突触”集成在直径只有几厘米的方寸之间,能耗不到70毫瓦。




  通用芯片和专用芯片各有千秋,未来将是并存局面。芯片是指内含集成电路的硅片,是机器人的大脑。芯片包括通用芯片和专用芯片,通用芯片不限使用领域,而专用芯片一般为专门为服务机器人定制。对于机器人来说,由于涉及到深度神经网络,故在计算量上将会更大,通用芯片中GPU和FPGA在解决这问题上优于传统CPU,扩展性和移植性较好,但是软件复杂度和开发周期较高;相比之下,专用芯片能实现更高的效率和更低的功耗,但是目前整体处于研发阶段,根据目前的资料,虽然其扩展性和软件移植性不如通用芯片,但是软件复杂度和开发周期优于通用芯片。两种芯片各有千秋,未来预计是并存局面。

  2 两大主流操作系统之外,国产系统正在孕育

  全球机器人主流操作系统是安卓和ROS,两者均基于linux内核。安卓由Google公司开发,在商用领域有广泛应用,占据智能手机和平板电脑的绝大部分市场份额,在机器人上也有广泛应用。ROS诞生于斯坦福AI实验室,在学术和研究领域广受欢迎,目前的应用更偏向于在工业机器人领域和工业控制。除此之外,法国Aldebaran公司自主开发的NAOqi操作系统也较为知名,国产操作系统TuringOS、iBotOS等也在突破。




  实现了手机的爆发后,安卓又被广泛用在不同设备上。鉴于安卓开源和定制化的特性,在手机上得到广泛应用后,在平板电脑、电子书、智能电视、智能机器人、智能眼镜、智能手表、智能耳机等领域,安卓不断的攻城略地,截至2015年底,安卓被用在24,093种不同的设备上,比上年增长了28%。




  得益于广泛硬件市场,安卓生态圈应用数全球第一。据AppFigures发布的报告显示,谷歌Play商店中的应用数超越了比苹果iosAppstore中的应用数,截至2014年底,谷歌Play拥有143万款应用,而苹果iosAppStore仅有121万款应用。鉴于此,为吸引更多开发者,原本搭载基于ROS自己研发的NAOqi系统的Pepper机器人,也在自身操作系统上增加了Android系统层,供开发者开发应用。




  ROS诞生于实验室,使用机器人类型快速增长。ROS系统诞生于2007年斯坦福人工智能实验室。当时是为了支持一个名STAIR项目,在项目之初,机器人平台集合了所有AI的方法,包括机器学习、视觉、导航、计划、推理、语音和语言处理。2008年到2013年,WillowGarage与超过20家研究机构的工程师一起合作开发ROS系统。2013年2月,ROS的管理工作转移到OpenSourceRoboticsFoundation,2013年8月WillowGarage公司被它的创立者转为另一家创立者成立的公司SuitableTechnologies的子公司,WillowGarage对PR2的支持工作随后交给了ClearpathRobotics。自从2010年至今,搭载ROS系统的机器人类型数从0起步至目前的106种。




  ROS系统主要应用于智能机器人。截至目前,ROS应用在106种机器人上,以智能机器人为主,其中又以移动机器人和智能交互机器人为主,包括著名的Pepper和NAO。目前已经有很多机器人公司采用了ROS系统来开发一些应用于全新市场的产品,如ClearPath,Rethink,Unbounded,Neurala,BlueRiver等,最典型的就是WillowGarage的PR2机器人。  

  国产操作系统在孕育。TuringOS是中国首批人工智能级可商用的机器人操作系统之一,是具备情感和思维能力的机器人操作系统,商业应用前景广阔。TuringOS拥有情感、思维、自学习三大引擎,情感计算引擎已支持25种语言类情感识别,识别准确率达95.1%,而在情感表达方面,TuringOS支持468类情感语言表达,88套表情动作表达组合,120种声音语调,能够让机器人模拟人类80%的情感表达模式。据图灵机器人后台数据显示,在近一年时间内其与超过13万的合作伙伴和开发者达成长期合作,共享知识库达到15亿项,应用领域累计覆盖用户超过3亿人次,进而每天可收集和积累亿级的用户大数据,在中文语言处理方面处于领先地位。

  六、投资建议与风险提示

  投资建议:

  我们建议从两个角度把握投资机会:(1)关注技术型平台公司,如AI芯片、OS、语音语义、感知等环节,重点公司包括地平线、图灵、寒武纪、智臻智能、云知声、科大讯飞、思岚科技等;(2)关注在细分领域做应用开发的企业,基于特定场景整合行业资源,重点关注的公司包括康力优蓝、科沃斯、优必选、未来伙伴等公司。上市公司建议关注巨星科技、康力电梯、慈星股份、永创智能、机器人、科大讯飞(广发计算机覆盖)等。

  风险提示:

  服务机器人市场需求低于预期;行业过度竞争;核心技术突破低于预期。  

关键词:机器人