当前位置:主页 > 医学论文 > 肿瘤论文 >

四种机器学习分类方法在乙肝相关肝癌诊断中的应用和比较

发布时间:2021-03-05 02:09
  目的医疗诊断是医生综合患者的症状体征和多种检查信息进行决策和判断的过程,其本质为分类。肝癌是我国最常见的恶性肿瘤之一,早期肝癌患者临床症状和各类检查的特征均不明显,因此难以筛查和诊断。本研究尝试使用机器学习中Logistic回归、加权k近邻、决策树、BP人工神经网络四种分类方法分别构建基于血清学指标的早期肝癌的诊断模型,比较模型的诊断效能,评估四种诊断模型的肝癌筛查价值和辅助临床医生进行早期诊断的可行性。比较四种分类方法的算法特点,探索每种方法在临床数据分析中合适的应用场景。方法选择2010年1月至2018年12月解放军总医院第五医学中心收治的5642例慢性乙型肝炎病毒感染者为研究对象,其中慢性乙型肝炎患者1425例,代偿期肝硬化患者567例,失代偿期肝硬化患者731例,肝癌患者2919例。2919例肝癌患者中符合米兰标准的有808例,定义为早期肝癌患者。本研究只关注早期肝癌,因此研究总样本为3531例。使用分层抽样的方法按照7:3的比例将总样本分为训练集和测试集。训练集中使用Logistic回归、加权k近邻、决策树、BP人工神经网络分别构建早期肝癌的诊断模型,并得到相应模型的最佳参数... 

【文章来源】:郑州大学河南省 211工程院校

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

四种机器学习分类方法在乙肝相关肝癌诊断中的应用和比较


图2.1研宄流程图??6??

原理图,算法模式,近邻,函数图像


?对象与方法???通过梯度下降的方法多次迭代计算即可估算出自变量的回归系数。见图2.2。???_?5.?■?r?[.....|?.'丨'??I-?/?:|?I??〇?.,??〇?^ ̄ ̄|?1?1?1?1 ̄?!??-4?-2?0?2?4??图2.2?Sigmoid函数图像(左)和梯度下降算法模式图(右)??2.3.2加权k近邻算法原理??k近邻算法思想非常朴素。首先将训练集的观察对象依据其变量值投射到高??维空间,每个观察对象就是高维空间中的一个点。观察对象之间的变量属性越相??似,这些点的空间距离就会越近。因此相似的观察对象在高维空间中表现出一定??的空间聚集性。在本次研究中,当将模型应用于测试集时,实际上是将测试集中??的每一个观察对象依据其变量信息(向量)投射到由训练集构成的高维空间图上。??选取距离每一个测试集观察对象最近的k个点,k个点中如果肝癌患者多则该对??象被判定为肝癌,如果非肝癌患者较多则该对象被判定为非肝癌。见图2.3。??k近邻法有两个非常重要的问题需要解决。一是不同的k取值会影响诊断效??能;二是对于需要判定的测试集点,不同距离的训练集点对判定的影响力有所不??同,距离越近,判定的权重应该越大。针对第一个问题可以借助计算机强大的计??算能力,通过穷举的方式进行解决。针对第二个问题,可以通过核函数赋予距离??更近的点更大的权重进行解决,该方法就是加权k近邻算法。见图2.3。??e?Hn??\?①?令)屮???——.L、 ̄???;g\.?y?^?矩形核函数?=??????%*?yv?/\??仿数核嘁数?A期搞成数??图2.3?k近邻算法判定原理(左)

原理图,近邻,核函数,算法


?对象与方法???通过梯度下降的方法多次迭代计算即可估算出自变量的回归系数。见图2.2。???_?5.?■?r?[.....|?.'丨'??I-?/?:|?I??〇?.,??〇?^ ̄ ̄|?1?1?1?1 ̄?!??-4?-2?0?2?4??图2.2?Sigmoid函数图像(左)和梯度下降算法模式图(右)??2.3.2加权k近邻算法原理??k近邻算法思想非常朴素。首先将训练集的观察对象依据其变量值投射到高??维空间,每个观察对象就是高维空间中的一个点。观察对象之间的变量属性越相??似,这些点的空间距离就会越近。因此相似的观察对象在高维空间中表现出一定??的空间聚集性。在本次研究中,当将模型应用于测试集时,实际上是将测试集中??的每一个观察对象依据其变量信息(向量)投射到由训练集构成的高维空间图上。??选取距离每一个测试集观察对象最近的k个点,k个点中如果肝癌患者多则该对??象被判定为肝癌,如果非肝癌患者较多则该对象被判定为非肝癌。见图2.3。??k近邻法有两个非常重要的问题需要解决。一是不同的k取值会影响诊断效??能;二是对于需要判定的测试集点,不同距离的训练集点对判定的影响力有所不??同,距离越近,判定的权重应该越大。针对第一个问题可以借助计算机强大的计??算能力,通过穷举的方式进行解决。针对第二个问题,可以通过核函数赋予距离??更近的点更大的权重进行解决,该方法就是加权k近邻算法。见图2.3。??e?Hn??\?①?令)屮???——.L、 ̄???;g\.?y?^?矩形核函数?=??????%*?yv?/\??仿数核嘁数?A期搞成数??图2.3?k近邻算法判定原理(左)


本文编号:3064382

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/3064382.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b1d2f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com