当前位置: 首页 > 资讯

【原创】吴恩达团队用CNN识别肺炎影像,结果优于人类医生

机器人网       2017-11-17

据美国疾控中心的数据,仅在美国每年就有100多万成年人因肺炎住院,约5万人死于该疾病。世界卫生组织表示,目前,胸部X光是诊断肺炎的最佳方法,这在临床护理和流行病学研究中都发挥着重要作用。然而,虽然X光很有效,但仍要求放射科医生具备高水平的诊断能力。因为X光片中的肺炎往往很模糊,有时还会与其他病症相重叠,有时甚至会被误诊为其他良性疾病。

最近,著名深度学习专家吴恩达和他在斯坦福大学的团队发明了一种名为CheXNet的新技术,这是一种新的机器学习模型,它的算法是一个121层的卷积神经网络。将一张胸部X光片输入其中,就能输出病人得肺炎的概率以及热图。这些热图能显示出肺炎的发病区域。

【原创】吴恩达团队用CNN识别肺炎影像,结果优于人类医生

模型构建

CheXNet是一个121层的密集卷积网络,被应用于ChestX-ray 14上进行训练。ChestX-ray 14是当前公开的最大胸部X光片数据集,内含112120张前胸X光片,包括14种不同的疾病。

CheXNet通过神经网络改善信息流和梯度,能更容易地优化深层的网络。研究人员用单输出图像替换最终的全连接图层,然后通过一个Sigmoid非线性方程得出的肺炎的概率。

训练与测试

在ChestX-ray 14的数据集里,之前的研究人员将里面超过10万张X光片用放射学报告的自动提取方法进行标注。在本次实验中,斯坦福大学的研究人员们将标为肺炎的片子记为正,其他13种疾病标位负。然后将这些数据随即打乱,选出其中80%用于训练,剩下的20%用来验证。另外,研究人员还随机选出图像进行翻转,增加训练数据。

其中,他们手机了420张前胸X光片组成一个测试集,让四位斯坦福大学的职业放射科医生这些照片进行标注。他们分别由4年、7年、25年和28年的从医经验,其中一位还专门接受过胸部放射科培训,是一名附属专科医生。他们除了一张X光片,再无其他信息可了解。他们得出的结果将被输入一个标准程序中。

CheXNet vs. 人类医生

研究人员在受试者操作特征曲线(ROC曲线)上表示出人类医生和CheXNet的判断结果,横坐标为1-特异度(假阳性率),纵轴为灵敏度(真阳性率)。下图就显示了四名放射科医生的判断结果(橙色)和他们的平均值(绿色)。

【原创】吴恩达团队用CNN识别肺炎影像,结果优于人类医生

CheXNet在ChestX-ray上检测患者得肺炎的概率,并通过改变用于分类器边界的阈值形成蓝色的ROC曲线。通过计算,人们得出ROC曲线下面积(AUROC)为0.788(该值的范围在0~1之间,数值越大,分类器正确率越高),并且图中可以看出每位医生及他们的平均值都处于ROC曲线之下,表明CheXNet已经能达到人类医生的水平,甚至超过医生检测出肺炎。

但是这种对照还存在两点不足:首先,不论是模型还是医生,在判断之前是不了解患者信息的,这有可能会影响医生的判断;另外,我们只提供了正面X光片,但是有研究显示15%的精准诊断需要参考后背X光片。希望这个结果有可能低估了人类医生的水平。

CheXNet vs. 其它工具

接着,研究人员又将算法扩展,不再让CheXNet输出一个二类标签,而是判断一张图片是否有多种疾病,即ChestX-ray 14中的14种疾病:肺不张、心脏肿大、肺实变、肺水肿、胸腔积液、肺气肿、纤维病变、疝气、浸润、肿块、结节、胸膜增厚、肺炎和气胸。然后将CheXNet与以往的成果相比较,结果展示在下表中。

【原创】吴恩达团队用CNN识别肺炎影像,结果优于人类医生

可以看到,CheXNet的表现胜过之前的两个模型。在肺不张、肿块、结节、肺炎和肺气肿方面,CheXNet的AUROC值均比之前的模型增加了0.05以上。

热图解读

最后,为了解释CheXNet的预测,研究人员利用类激活图(CAM)产生热图,让病变区域可视化。下图中红色区域即表示病变最严重的地方,需特别注意。

【原创】吴恩达团队用CNN识别肺炎影像,结果优于人类医生

结语

研究人员希望CheXNet能够应用到医疗资源紧张的地区,帮助人们精准、快速地检测疾病。同时该小组还在医学领域做着其他研究,例如检测不规则的心脏跳动以及建立电子病历数据库。

小组成员、论文的合著者杰里米·欧文(Jeremy Irvin)说:“我们将继续致力于医疗算法的研究,提高医学检测的质量。同时,我们还希望能提供匿名的医学数据集,以便其他人开展类似工作。机器学习是改善医疗保健系统的重要工具,我们希望能不断创新,在这一领域处于领先地位。”

【原创】吴恩达团队用CNN识别肺炎影像,结果优于人类医生

放射科医生Matthew Lungren(左)与小组成员Jeremy Irvin和Pranav Rajpurkar会面,讨论算法检测结果

关键词:CNN