于静汶 朱东弼
摘 要 医疗影像AI是未来智能医疗发展的重要部分。因而基于深度神经网络的肺部结节自动检测方案研究是未来医疗影像AI的研究热点之一。本文分析现有的肺部结节自动检测方案及存在的问题,并提出一种基于深度神经网络的肺部结节自动检测的新的研究方案,即将传统方法与深度学习方法相结合,前期预处理部分采用传统方法进行,后期网络模型中采用改进的卷积神经网络方法(将改进的VGGNet网络模型和改进的ResNet网络模型级联)。运用新的研究方案来提高检测准确率,对促进医疗的发展具有重要的意义。
关键词 肺结节;自动检测;深度学习;卷积神经网络
中图分类号: TN929.5 文献标识码: A
DOI:10.19694/j.cnki.issn2095-2457.2020.02.051
0 引言
近年来,随着社会经济的不断发展,肺癌的发病率、致死率已位列常见恶性肿瘤的第1位,且随着我国人口老龄化,罹患肺癌的总人数呈现持续升高态势[1]。循证医学数据显示,早期肺癌5年的生存率显著高于中晚期肺癌,故早发现、早诊断及早治疗是改善预后的重要途径。肺癌的早期表现形式是肺结节,因此肺结节的检测对于早期肺癌的确诊有着重大的帮助。传统肺结节的检测方法是医生通过肉眼观察肺部的数百张CT图像切片来找出每一张CT图像切片中是否含有肺结节,然而较微小的肺结节在CT影像上看与血管较为相似,容易遗漏,因此医疗影像辅助诊断就显得尤为重要。故帮助医生准确快速地检测出肺结节是在未来智能医疗领域医疗影像AI方向中需要解决的问题之一[2]。本文分析现有的肺结节检测中出现的问题,并在此基础上提出新的新的解决方案。
1 智能医疗领域中肺结节检测方案分析及存在的问题
在智能医疗的大环境下,肺结节的检测研究主要分成了两个方向:机器学习检测肺结节以及深度学习的方法检测肺结节。
机器学习检测肺结节就是在数据量较少的情况下由专家手动标记像素值,形状,纹理等特征。深度学习检测肺结节需要大量的数据,该方法可以从数据中直接获取更高等级的特征,深度学习削减了对每一个问题设计特征提取器的工作。在智能医疗发展的大环境下,采用何种肺结节检测方法将直接影响肺结节检测的准确率。
在早期的肺结节检测当中,研究人员主要集中在借助结节类型的病理知识提取鉴别形态特征,并应用相对简单的线性分类器,如logistic回归或支持向量机(Lee等[3]人提出基于改进模板匹配技术的螺旋CT肺结节自动检测,Ye等[4]人提出了在胸部CT图像中基于形状的肺结节计算机辅助检测的方法)。对于肺结节的传统检测技术,主要是运用基于传统的机器学习的方法。该方法流程较烦琐,更多的是利用人工设计的特征,制约了算法的性能。
近年来,伴随着医疗影像大数据趋势的发展以及深度神经网络在单一框架下学习层次特征表示和分类识别的流行和成功,越来越多的研究学者借助深度学习的方法来解决肺结节检测的问题。Ross Gruetzemacher等[5]人使用卷积神经网络对肺实性结节进行良恶性判别,最终通过10层隐藏层的网络结构,对肺结节进行检测,准确率为82.10%。Shelia Ramaswamy等[6]人利用现有的卷积神经网络模型AlexNet,GoogleNet等对15562张肺部CT进行了识别,准确率为89.6%。刘家宝[7]利用CNN识别肺结节的良恶性属性,以残差网络为主干网络,在置信度阈值选取为0.58时,实现了90.8%的准确率。WANG[8]提出了一种基于多视角卷积神经网络(MV-CNN)的方法,该网络利用全连接层整合了三条卷积神经网络分支,可有效地对多种肺结节检测。
这些方法的共同特点是敏感性高,特异性低,识别率不高,研究空间大。上述不同类型的算法从不同的角度对肺结节进行了检测,不同的算法各有优劣、各有侧重点,但这些算法对于提高假阳性肺结节检测率以及一些难例肺结节的检测,仍存在一些缺陷目前并没有得到解决。
现阶段研究学者们检测肺结节大部分都是直接采用端到端的检测方式。如果将病例图片先用传统方法进行肺实质分割处理后再用深度学习方法进行肺结节的检测可以大大减少后续操作并且有效的弥补在检测肺结节中仅采用以上算法而导致的缺点。通过应用该改进算法可以提高检测肺结节的准确率,有效解决了一些难例肺结节难以检测或检测出假阳性肺结节的情况。
2 新的肺结节检测方案探讨
2.1 病例图像预处理(肺实质分割)
由于肺部组织结构复杂,同时受低剂量CT扫描设备的影响,肺部CT图像还存在高噪声和伪影现象,这些问题一定程度上影响了肺实质分割的准确性。为了减少上述因素对分割准确性的干扰,需要对病例CT图像做滤波操作(高斯滤波)和去噪操作(ROF去噪)以及图像增强操作。
为了减少检测区域,节省运算时间,提高准确率,在肺部疾病的计算机辅助诊断中,肺实质的正确分割尤为重要。首先对病例图像进行全局阈值的操作,对连通区域标记获取轮廓,利用基于阈值的改进算法去除气管、肺液等干扰,分离肺实质与背景,运用区域生长法对左右肺叶粘连的情况进行有效分离,并提取最大连通区域,然后进行孔洞填充与掩膜相减操作,剔除面积小于1000的连通区域后,用掩膜乘原图即可得到肺实质分割图像。
2.2 改進后的卷积神经网络算法检测肺结节
改进后的卷积神经网络算法检测肺结节可以包含两个阶段:(1)肺结节候选检测,(2)假阳性抑制。
在第一个阶段肺结节候选检测中该方法的基本特征提取的网络是VGG卷积神经网络。在较大的肺部图像中检测较小的结节是一项具有挑战性的任务。肺结节的最小直径约为3毫米,最大尺寸约为30毫米,属于图像中非常小的物体。由于肺结节的这一特点,在使用CNN进行肺结节检测时,感受野的选择对肺结节的检测具有重要的意义。经过一系列的卷积和汇集,感受野变大。由于小的特征图不能清晰地表示结节的特征,会导致其检测ROI区域受到限制。故在改进过程中要使卷积层的特征图大一些。
神經网络的一个普遍的规律是:浅层网络的感受野小,提取到的是局部特征,深层网络感受野更大,提取到的是一些物体级别的高语义特征,对于识别目标尤为重要,决定了模型的表达能力。故在第一个阶段肺结节候选检测中改进VGG网络模型,把由浅到深的两个VGG模型级联,做到可以由粗到细的筛选候选肺结节。
在第二个阶段中之所以采用ResNet网络模型作为假阳性抑制模型的基本特征提取网络,是因为当网络变得越来越深的时候,训练的准确率会趋于平缓,为了解决这一问题,引入残差块。然后把改进后的Resnet模型和VGG模型进行级联,可以提高假阳性肺结节检出率。
该改进后的方案可以有效地解决一些难例肺结节难以检测或检测出有假阳性肺结节的情况。并且可以减轻放射科医生的负担,为医生提供了更客观更准确地诊断结果,具有重要的临床应用价值和研究意义。
3 结论
本文分析了智能医疗领域中现有的肺结节自动检测方案以及存在的问题,以此为基础,提出并讨论了一种全新的肺结节检测方案。该方案运用传统方法对病例图像进行了预处理操作(肺实质分割),并改进已有的卷积神经网络对肺结节进行检测,可以提高难例肺结节的检出率,为智能医疗打下了夯实的基础。
参考文献
[1]邹小农,中国肺癌流行病学,中华肿瘤防治杂志,2007,14(2);881-883.
[2]R.LSiegel,K.D.Miller,A Jemal,Cancer statistics,2016,CA,Cancer J,Clin.2016.
[3]Lee Y,et al Automated detection of pulmonary nodules in helical CT images based on an improved template-matching technique.IEEE Transactions on Medical Imaging, 20(7)(2001), pp. 595-604.
[4]Ye X,et al Shape-based computer-aided detection of lung nodules in thoracic CT images.IEEE Transactions on Biomedical Engineering,56(7)(2009),pp.1810-1820.
[5]Gruetzemacher R,Gupta A.Using deep learning for pulmonary nodule detection&diagnosis[J].2016.
[6]Ramaswamy S,Truong K.Pulmonary Nodule Classifica tion with Convolutional Neural Network[J].2018.
[7]刘家宝.CT肺结节诊断的计算机辅助系统研究[D].北京:首都医科大学,2017.
[8]WANG S ZHOU M,GEVAERT O,et al A multi-view deep convolutional neural networks for lung nodule segmentation[C].Proceedings of AnNual International Conference of the IEEE Engineering in Medicine and Biology Society,2017:1752-1755.