尘肺胸片人工智能读片三种模型效能比较研究

引用

摘要：

[背景]尘肺病的人工诊断受到多种因素的影响,容易出现漏诊误诊情况.人工智能在医学影像领域的发展十分迅速,考虑能否利用人工智能实现对尘肺病影像的读片.[目的]基于深度卷积神经网络的方法构建三种深度学习模型,进行尘肺病有无的诊断.评价三种模型诊断效能并进行对比,挑选出最优的模型.[方法]收集7家医院在2017年6月—2020年12月拍摄的数字X线摄影(DR)胸片并对胸片进行质量控制.收集的DR胸片中尘肺诊断阳性为阳性组,无尘肺胸片为阴性组.由通过阅片考核的专家对收集胸片进行标注,标注过程中不断进行基于最大期望算法的一致性考核.标注后的数据经数据清洗、数据归档、预处理后纳入训练集和验证集.构建TMNet、ResNet-50和ResNeXt-50三种深度卷积神经网络模型,采用十折交叉验证法对模型进行训练,得到最优的模型.收集未纳入训练集和验证集的500例DR胸片,经由5位资深专家共同鉴定作为金标准成为测试集.通过测试,得到三种模型的准确率、灵敏度、特异度、受试者工作特征曲线下面积(AUC)等指标,评价三种模型性能并进行对比.[结果]本研究共收集训练集与验证集DR胸片24867张,其中阳性组6978例,阴性组17889例.收集胸片中肺部异常情况如气胸、肺结核等共有312例.共有9名专家对胸片进行了标注,尘肺异常(不分期)的标注一致性率均在88％以上,尘肺分期的标注一致性率从84.68％到93.66％不等.TMNet的诊断准确率为95.20％,灵敏度达到99.66％,特异度为88.61％,AUC值为0.987.ResNeXt的诊断准确率为87.00％,灵敏度达到89.93％,特异度为82.67％,AUC值为0.911.ResNet的诊断准确率为84.00％,灵敏度达到85.91％,特异度为81.19％,AUC值为0.912.TMNet模型的上述指标均高于ResNeXt-50和ResNet-50模型.TMNet与另外两个模型AUC差值的差异有统计学意义(P<0.001).[结论]三种卷积神经网络模型均可有效诊断尘肺病的有无,其中TMNet的效能最好.

关键词：尘肺病;卷积神经网络;人工智能;深度学习

所属期刊栏目：39

分类号：R13(劳动卫生)

在线出版日期：2022-03-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：41-46

英文信息展示

期刊专题