基于深度学习的白血细胞分类识别方法研究
发布时间:2020-05-07 13:31
【摘要】:目前白血细胞类型的识别多用三分类血液检测仪或五分类血液检测仪,而这些仪器也并不能做到识别分类的高精准化。这些仪器只能识别和统计常规的三分类或五分类白血细胞类型,不能详细精准地统计拥有40种之多的全部白血细胞类型。如果能更加智能化、精准化和全面化地识别白血细胞的具体所属类型,而不是粗略划分的三分类或五分类,将给医生对于白血病患者诊疗起到非常好的辅助作用。针对上述问题,本文基于深度学习的理论对构建40种白血细胞进行分类识别的神经网络和提高分类准确率做了重点研究。论文的主要工作如下:本研究首先设计了一种基于深度卷积神经网络和残差算法的白血细胞分类方法。对于不同种类的白血细胞的识别,其实质就是一种视觉图像的分类处理。而卷积神经网络(CNN)在对图像的局部特征的提取有着得天独厚的优势,其强大之处主要表现在三大特性:局部感知,参数共享以及多核卷积。这些特征让其训练参数大为缩减,并且使得特征的提取更加高效方便。基于此认知,本文通过大量的实验实践设计出一个深度有33层的卷积神经网络分类器,并且通过大量图像样本训练之后可以提取具有82%分类准确率的网络模型。该模型对40种白血细胞的识别分类可以用于临床诊断。由于血细胞领域的限制,我们所获得的白血细胞数据集中各类别数量是极其不均匀,某些类别的样本稀少。像对于通常血检所获得的白血细胞三种类别(大细胞群、中细胞群、小细胞群)的图像较为容易获取且资源较多,而对于更为详细的40分类的白血细胞图像资源较为稀少。针对这样的问题,本文又提出一种基于迁移学习的白血细胞分类识别方法。首先本文设计出一种具有三分类的能够自动提取白血细胞图像显著特征的卷积神经网络架构,再用充足的三分类训练样本拟合网络参数,然后提取出效果较好的三分类模型。其次再设计一种具有40分类的卷积神经网络架构(CNN),而该架构的特征提取层与三分类特征提取层结构相同,故可将三分类模型的特征提取层参数迁移至40分类CNN架构中去,然后利用相对不充足的40分类数据集来训练该40分类架构,最终可以获得具有89%分类准确率的网络模型。最后本文经大量的实验表明本文所提出的基于迁移学习的方法要优于单纯使用CNN或传统的白血细胞自动分类的方法,证明了该方法的可行性与有效性。
【图文】:
图 2.1 白血细胞自动分类处理展示对于白血细胞的分类研究而言,,常常都是先进行样本数据的特征提取,合适的分类器来做拟合参数的训练。下面介绍一些常用的分类器算法。KNN(K Nearest Neighbors)算法[17]或称为 K 最近邻分类算法。“k 最邻思义,即如果要表示一个样本值就可以利用 k 个距离上最接近该值的样达。该种算法的主要思想是,若是一个数据点在特征空间上有 k 个与其的数据点并且这 k 个数据点大部分是某一种类型,那么这个数据点也应型。这种算法在判定某个数据点所属种类时需要获知其最相邻的多个数类。正是因为 KNN 算法在判定样本类别依靠的是分布在样本周围的环境通过样本本身所具有的一些特点信息,所以这种方法在处理某些类别间区域较多的问题时效果十分显著。但是如果不同类别的数据对分布十分那么该方法则难以应对。当其中某一类或几类样本数量较多,而其他的,则会使得在预测新样本所属类别时,算法偏向于采用样本最近的 k 个量占比最多的那一类类别。因此这种分类算法仅在处理数据量大并且较数据集时效果会很不错。
杭州电子科技大学硕士学位论文层次结构组合的网络,它的层次结构类似于生物神经系统,并的信号做出一些列反应。在自然生物神经系统中,神经元是其每个神经元与其他神经元相连,当一个神经元变兴奋时便会向神经元传递信号,从而后面神经元的电位发生变化;若该神经值”(threshold)则会被激活并继续向下面的神经元传递信号。图 2.2 是一个简单的神经元模型:
【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R446.1;TP18
本文编号:2653048
【图文】:
图 2.1 白血细胞自动分类处理展示对于白血细胞的分类研究而言,,常常都是先进行样本数据的特征提取,合适的分类器来做拟合参数的训练。下面介绍一些常用的分类器算法。KNN(K Nearest Neighbors)算法[17]或称为 K 最近邻分类算法。“k 最邻思义,即如果要表示一个样本值就可以利用 k 个距离上最接近该值的样达。该种算法的主要思想是,若是一个数据点在特征空间上有 k 个与其的数据点并且这 k 个数据点大部分是某一种类型,那么这个数据点也应型。这种算法在判定某个数据点所属种类时需要获知其最相邻的多个数类。正是因为 KNN 算法在判定样本类别依靠的是分布在样本周围的环境通过样本本身所具有的一些特点信息,所以这种方法在处理某些类别间区域较多的问题时效果十分显著。但是如果不同类别的数据对分布十分那么该方法则难以应对。当其中某一类或几类样本数量较多,而其他的,则会使得在预测新样本所属类别时,算法偏向于采用样本最近的 k 个量占比最多的那一类类别。因此这种分类算法仅在处理数据量大并且较数据集时效果会很不错。
杭州电子科技大学硕士学位论文层次结构组合的网络,它的层次结构类似于生物神经系统,并的信号做出一些列反应。在自然生物神经系统中,神经元是其每个神经元与其他神经元相连,当一个神经元变兴奋时便会向神经元传递信号,从而后面神经元的电位发生变化;若该神经值”(threshold)则会被激活并继续向下面的神经元传递信号。图 2.2 是一个简单的神经元模型:
【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R446.1;TP18
【相似文献】
相关期刊论文 前1条
1 郭扬;宋裕如;陈波;王舒;;“白血”释义及临床应用[J];四川中医;2017年10期
相关硕士学位论文 前1条
1 程柳;基于深度学习的白血细胞分类识别方法研究[D];杭州电子科技大学;2018年
本文编号:2653048
本文链接:https://www.wllwen.com/linchuangyixuelunwen/2653048.html
最近更新
教材专著