基于深层迁移学习的DR胸片肺结核病灶检测
发布时间:2021-03-08 19:45
针对基于传统机器学习方法设计的DR胸片肺结核检测器存在着泛化能力不强,实际检测精度低等问题,提出了一种基于Focal Loss的深度学习检测方法Tuberculosis Neural Net(TBNN).医学图像的特殊性,存在带标注的数据量小导致无法充分训练深层网络模型等问题.该方法利用肺炎和肺结核同为呼吸道感染疾病且在DR胸片上有相似表征的特点,基于迁移学习原理训练特征提取子网络,减少肺结核胸片样本不足对模型训练造成的影响.首先在大型的肺炎胸片数据集上训练特征提取网络,以获取DR图像中丰富的深层图像语义信息,然后使用样本较少的肺结核数据集微调网络参数,并将多层卷积的输出作为TBNN分类子网络的输入,得到基于DR胸片的肺结核病灶检测模型.实验结果表明,该方法生成的检测模型在分类精度和性能上均优于基于传统机器学习的肺结核检测器.在同等训练数据量和训练周期下,模型性能高于其他采用传统数据增强方法的深层网络肺结核检测算法,且能标识病灶区域,准度上有不低于放射科阅片医生的表现.
【文章来源】:四川大学学报(自然科学版). 2020,57(03)北大核心
【文章页数】:10 页
【部分图文】:
基于Focal Loss的检测框架
传统的机器学习只有在训练集数据和测试集数据都来自同一个域和同一分布的时候才能很好运行,但是在实际应用中,这种假设可能不成立.模型的泛化能力以及迁移能力很低,这也是运用传统机器学习方法处理医学图像问题的缺陷之一.根据经验,至少需要2万张胸片才能充分训练一个深度神经网络.迁移学习指从一个或多个任务的域中提取知识并将知识应用于目标任务的方法.即一个域D由两个部分组成:特征空间X以及边缘概率分布P(X),其中,X={x1,…,xn}∈X,指某个特定的学习样本;一个任务T由输出空间 Y= { y 1 , ? ,y n } 和预测函数 f( ? )=Ρ(Y|X) 组成.T不能被观察,但是可通过训练多组数据 { x i ,y i } ,x i ∈X,y i ∈Y 被学习.假设有两个域DS和DT以及不同的学习任务TS和TT,迁移学习就是利用DS和TS的知识来改善任务TT的预测函数f(·)在域DT中的表现能力.基于肺炎在DR影像学上表征和肺结核相似的特点,本文采用图2所示的深层迁移学习方法实现DR胸片肺结核病灶检测.小样本肺结核标注数据DT和目标结核检测任务TT,从肺炎检测TS训练肺炎标注数据DS的过程中,学习知识以充分训练深层特征提取网络用于肺结核检测任务TT.假设DS={(xS1,yS1),…,(xSn,ySn)},DT={(xT1,yT1),…,(xTn,yTn)},TS={YS,P(YS|XS)},TT={YT,P(YT|XT)},其中xSi∈XS,ySi∈YS,xTi∈XT,yTi∈YT.深层神经网络提取特征过程如式(4),当域DS中特定数据{xm,ym}通过f(xm)计算后,若 y ︿ m =y m ,则认为特征提取成功.
2) 真实性.由于阅读医学图像需要具备丰富的医学理论知识,我们从收集的胸片中,按图3的三级递进式诊断中整理出1 935张疑似肺结核胸片由华西医院结核专家做标注.3) 准确性.除了对肺结核胸片打标签外,还利用矩形框对病变区域做了像素级标注.标注前胸片已进行了脱敏处理,只保留其图像信息,如图4.将标注信息和图像相匹配后,得到表1所示的肺结核标注数据集.其中,X, Y, Width, Height分别表示标注框的左上顶点的坐标以及标注框的宽和高的像素值.
【参考文献】:
期刊论文
[1]基于卷积神经网络的乳腺病理图像识别算法[J]. 凌语,孙自强. 江苏大学学报(自然科学版). 2019(05)
[2]低倍率镜检图像无标记红白细胞识别方法研究[J]. 王伟,司淼淼,陈芙蕖,刘慧,姜小明,李章勇. 重庆邮电大学学报(自然科学版). 2019(04)
[3]基于空间像素强度的脑瘤图像检索方法[J]. 李清亮,张子鹏,时玮淞,蒋振刚,赵家石,师为礼. 吉林大学学报(理学版). 2018(03)
[4]基于Spark的并行医学图像处理研究[J]. 兰云旭,王俊峰,唐鹏. 四川大学学报(自然科学版). 2017(01)
[5]基于SURF的肺结核DR图像病变区域检测[J]. 符尧,王俊峰,高琳,姬郁林,张菊英. 计算机工程与设计. 2015(09)
本文编号:3071570
【文章来源】:四川大学学报(自然科学版). 2020,57(03)北大核心
【文章页数】:10 页
【部分图文】:
基于Focal Loss的检测框架
传统的机器学习只有在训练集数据和测试集数据都来自同一个域和同一分布的时候才能很好运行,但是在实际应用中,这种假设可能不成立.模型的泛化能力以及迁移能力很低,这也是运用传统机器学习方法处理医学图像问题的缺陷之一.根据经验,至少需要2万张胸片才能充分训练一个深度神经网络.迁移学习指从一个或多个任务的域中提取知识并将知识应用于目标任务的方法.即一个域D由两个部分组成:特征空间X以及边缘概率分布P(X),其中,X={x1,…,xn}∈X,指某个特定的学习样本;一个任务T由输出空间 Y= { y 1 , ? ,y n } 和预测函数 f( ? )=Ρ(Y|X) 组成.T不能被观察,但是可通过训练多组数据 { x i ,y i } ,x i ∈X,y i ∈Y 被学习.假设有两个域DS和DT以及不同的学习任务TS和TT,迁移学习就是利用DS和TS的知识来改善任务TT的预测函数f(·)在域DT中的表现能力.基于肺炎在DR影像学上表征和肺结核相似的特点,本文采用图2所示的深层迁移学习方法实现DR胸片肺结核病灶检测.小样本肺结核标注数据DT和目标结核检测任务TT,从肺炎检测TS训练肺炎标注数据DS的过程中,学习知识以充分训练深层特征提取网络用于肺结核检测任务TT.假设DS={(xS1,yS1),…,(xSn,ySn)},DT={(xT1,yT1),…,(xTn,yTn)},TS={YS,P(YS|XS)},TT={YT,P(YT|XT)},其中xSi∈XS,ySi∈YS,xTi∈XT,yTi∈YT.深层神经网络提取特征过程如式(4),当域DS中特定数据{xm,ym}通过f(xm)计算后,若 y ︿ m =y m ,则认为特征提取成功.
2) 真实性.由于阅读医学图像需要具备丰富的医学理论知识,我们从收集的胸片中,按图3的三级递进式诊断中整理出1 935张疑似肺结核胸片由华西医院结核专家做标注.3) 准确性.除了对肺结核胸片打标签外,还利用矩形框对病变区域做了像素级标注.标注前胸片已进行了脱敏处理,只保留其图像信息,如图4.将标注信息和图像相匹配后,得到表1所示的肺结核标注数据集.其中,X, Y, Width, Height分别表示标注框的左上顶点的坐标以及标注框的宽和高的像素值.
【参考文献】:
期刊论文
[1]基于卷积神经网络的乳腺病理图像识别算法[J]. 凌语,孙自强. 江苏大学学报(自然科学版). 2019(05)
[2]低倍率镜检图像无标记红白细胞识别方法研究[J]. 王伟,司淼淼,陈芙蕖,刘慧,姜小明,李章勇. 重庆邮电大学学报(自然科学版). 2019(04)
[3]基于空间像素强度的脑瘤图像检索方法[J]. 李清亮,张子鹏,时玮淞,蒋振刚,赵家石,师为礼. 吉林大学学报(理学版). 2018(03)
[4]基于Spark的并行医学图像处理研究[J]. 兰云旭,王俊峰,唐鹏. 四川大学学报(自然科学版). 2017(01)
[5]基于SURF的肺结核DR图像病变区域检测[J]. 符尧,王俊峰,高琳,姬郁林,张菊英. 计算机工程与设计. 2015(09)
本文编号:3071570
本文链接:https://www.wllwen.com/yixuelunwen/chuanranbingxuelunwen/3071570.html
最近更新
教材专著