基于卷积边缘增强的HER2图像分级算法的研究
发布时间:2021-08-24 04:21
在人类的各种癌症中,乳腺癌一直是威胁女性健康的恶疾之一。而相当程度的乳腺癌患者中存在着人类表皮生长因子受体2(HER2)基因扩增或蛋白高表达的情况,称为HER2阳性乳腺癌。作为一个独立预后指标,它对患者的治疗方案选择起着指导性作用。HER2分数的评定主要取决于浸润性癌细胞膜的染色程度与比例。过去,它的评定完全是基于人工观察的方式,不仅工作强度大,准确率在很大程度上也依赖于诊断者的从医经验与主观意识。基于此,本文主要研究在降低人为工作量和保证检测精度的前提下,优化用于HER2图像增强的卷积边缘检测与病理分类的CNN模型。本文的主要研究工作如下:(1)研究基于HER2病理切片的图像特点与判定标准,对原始切片的缩略图进行阈值二值化处理,并与人工标注区域取交集,以获取感兴趣区域。并在此基础上提取256×256图块,并用人工观察的方式选取无明显空白区域的图块,进行约16000张图块的标注。(2)以LBP、GLCM、HOG与LP、SVM两两结合的方式,在不同组合比例的样本数据上,研究利用少量标注数据自动化标注大量未标记数据的可行性预处理方案,并对实验结果做性能优劣的原理性分析。并选择效果表现较好的...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
全扫描切片标注图
武汉理工大学硕士学位论文132.2.2HER2分数评定HER2分数的评定有一套公认的客观标准[34],需要用肉眼在切片上对细胞膜染色比以及程度做出分辨,极度依赖主观的判定。0:无染色或≤10%的浸润癌细胞呈现不完整的、微弱的细胞膜染色(a);1+:>10%的浸润癌细胞呈现不完整的、微弱的细胞膜染色(b);2+:有两种情况,第一种为10%的浸润癌细胞呈现不完整弱至中等强度的细胞膜染色,第二种为≤10%的浸润癌细胞呈现强而完整的细胞膜染色(c);3+:>10%的浸润癌细胞呈现强而完整的细胞膜染色(d)。分数0与分数3+于肉眼观察程度上有着明显区别,但0与1+,1+与2+之间特征差距并不是很明显。其中,2+为HER2不确定病理,即无法明确HER2的基因扩增状态,需进一步应用FISH的方法进行HER2基因扩增状态检测。图2-3为20×物镜放大倍数下HER2四种分数的蛋白水平表达效果图。(a)0(b)1+(c)2+(d)3+图2-320×放大倍数下HER2不同分数的蛋白水平表达
武汉理工大学硕士学位论文142.3实验数据集的预处理因为卷积神经网络的训练需要大量已经标注的数据集,一般是以数万记以上。一般该过程是完全按照人工的方式,用肉眼筛选来进行标签标注,但其工作量过于庞大,且不能完全保证筛选出的HER2图像特征明显。故在此,本文旨在将传统特征提取算法结合分类算法,以求利用少量的样本达到HER2数据集预分类并自动化标注的目的,并做实验对比分析,从中选取合适的算法为后续CNN的训练标注完备的数据集。其数据集预处理标注过程如图2-4所示。图2-4实验数据预处理流程图2.3.1传统特征提取(1)LBP(LocalBinaryPattern,局部二值模式)LBP特征一般定义算子为3*3的矩阵,阈值为窗口中心像素的灰度值,并与相邻8个像素的灰度值进行比较,小的置为0,大的置为1,相当于二值化处理。而3*3矩阵除去中心阈值点后,还有8位。这8位数以顺时针的方向组合为一二进制数,称为LBP码。转为十进制后,则为该中心元素点的LBP值。如图2-5的(a)图所示。因为传统LBP算子不能满足HER2图像中不同频率纹理与尺寸的需要。且为了适应不同尺度的纹理特征,并达到灰度和旋转不变性的要求,本文此处用的是圆形LBP算子,为LBP的一个改进版本,如图2-5的(b)图所示。黑色实心圆点为采样点,中心空心白点为中心像素点,其半径分别为2和1。圆形邻域的算子在一定程度上满足了HER2图像下对不同纹理特征的要求。其纹理特征主要来自于圆边上的采样点,本文此处选择(b)图左边的LBP算子,采样点为16,代表着LBP码由16位二进制数组成,最多的情况可有65536种。但由于采样过后图像的维度不变,无法直接用以后续的分类,故利用统计直方图建立一个0-65535的LBP值分布。既保留特征信息之余,也达到了降维的目的。
本文编号:3359269
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
全扫描切片标注图
武汉理工大学硕士学位论文132.2.2HER2分数评定HER2分数的评定有一套公认的客观标准[34],需要用肉眼在切片上对细胞膜染色比以及程度做出分辨,极度依赖主观的判定。0:无染色或≤10%的浸润癌细胞呈现不完整的、微弱的细胞膜染色(a);1+:>10%的浸润癌细胞呈现不完整的、微弱的细胞膜染色(b);2+:有两种情况,第一种为10%的浸润癌细胞呈现不完整弱至中等强度的细胞膜染色,第二种为≤10%的浸润癌细胞呈现强而完整的细胞膜染色(c);3+:>10%的浸润癌细胞呈现强而完整的细胞膜染色(d)。分数0与分数3+于肉眼观察程度上有着明显区别,但0与1+,1+与2+之间特征差距并不是很明显。其中,2+为HER2不确定病理,即无法明确HER2的基因扩增状态,需进一步应用FISH的方法进行HER2基因扩增状态检测。图2-3为20×物镜放大倍数下HER2四种分数的蛋白水平表达效果图。(a)0(b)1+(c)2+(d)3+图2-320×放大倍数下HER2不同分数的蛋白水平表达
武汉理工大学硕士学位论文142.3实验数据集的预处理因为卷积神经网络的训练需要大量已经标注的数据集,一般是以数万记以上。一般该过程是完全按照人工的方式,用肉眼筛选来进行标签标注,但其工作量过于庞大,且不能完全保证筛选出的HER2图像特征明显。故在此,本文旨在将传统特征提取算法结合分类算法,以求利用少量的样本达到HER2数据集预分类并自动化标注的目的,并做实验对比分析,从中选取合适的算法为后续CNN的训练标注完备的数据集。其数据集预处理标注过程如图2-4所示。图2-4实验数据预处理流程图2.3.1传统特征提取(1)LBP(LocalBinaryPattern,局部二值模式)LBP特征一般定义算子为3*3的矩阵,阈值为窗口中心像素的灰度值,并与相邻8个像素的灰度值进行比较,小的置为0,大的置为1,相当于二值化处理。而3*3矩阵除去中心阈值点后,还有8位。这8位数以顺时针的方向组合为一二进制数,称为LBP码。转为十进制后,则为该中心元素点的LBP值。如图2-5的(a)图所示。因为传统LBP算子不能满足HER2图像中不同频率纹理与尺寸的需要。且为了适应不同尺度的纹理特征,并达到灰度和旋转不变性的要求,本文此处用的是圆形LBP算子,为LBP的一个改进版本,如图2-5的(b)图所示。黑色实心圆点为采样点,中心空心白点为中心像素点,其半径分别为2和1。圆形邻域的算子在一定程度上满足了HER2图像下对不同纹理特征的要求。其纹理特征主要来自于圆边上的采样点,本文此处选择(b)图左边的LBP算子,采样点为16,代表着LBP码由16位二进制数组成,最多的情况可有65536种。但由于采样过后图像的维度不变,无法直接用以后续的分类,故利用统计直方图建立一个0-65535的LBP值分布。既保留特征信息之余,也达到了降维的目的。
本文编号:3359269
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3359269.html
最近更新
教材专著