【摘要】:目的运用logistic回归、决策树、BP神经网络及支持向量机分别建立低增生性骨髓增生异常综合征(hypocellular myelodysplastic syndrome,hypo-MDS)与再生障碍性贫血(aplastic anemia,AA)的鉴别分类模型,以期为二者的鉴别诊断提供新的思路和方法。方法以2008年1月1日到2016年12月31日期间在中国医学科学院血液病研究所以及华北理工大学附属医院首诊确诊的hypo-MDS患者与AA患者作为研究对象,所有hypo-MDS患者和AA患者均符合2008年WHO修订的MDS分型标准和血液病诊断与疗效标准(第三版),且所有研究对象的病例信息均完整记录在册。收集研究对象的基本信息、外周血分类计数、外周血细胞形态学、骨髓细胞形态学等指标。采用Excel进行数据录入,Modeler14.1软件和Medcale软件进行统计学分析,建立hypo-MDS与AA的logistic回归模型、决策树模型、BP神经网络模型以及支持向量机模型,通过分别比较四种模型训练集与测试集的灵敏度、特异度、约登指数、+LR、-LR、AUC、准确率、Kappa值、PV+、PV-,得出最优分类模型,并分析最优模型误判数据特征。结果1共有286例患者纳入研究,hypo-MDS共130例,其中男性69例(53.08%),女性61例(46.92%);AA共156例,其中男性83人(53.20%),女性73人(46.80%)。两组患者在年龄与职业构成方面差异有统计学意义(P0.05),其他基本资料差异无统计学意义(P0.05)。2血细胞计数显示hypoMDS患者红细胞含量和血红蛋白含量低于AA患者,血涂片结果显示hypo-MDS患者分叶核中性粒细胞比例高于AA患者,成熟淋巴细胞比例低于AA患者,骨髓细胞形态学显示hypo-MDS患者早幼核中性粒细胞、晚幼核中性粒细胞、分叶核中性粒细胞、成熟淋巴细胞比例、成熟浆细胞比例低于AA患者,早幼红细胞、中幼红细胞、晚幼红细胞比例高于AA患者,差异有统计学意义(P0.05)。3分别建立基于logistic回归、BP神经网络、支持向量机以及决策树的hypo-MDS与AA的分类模型。针对训练集样本,logistic回归模型、BP神经网络模型、支持向量机模型以及决策树模型的灵敏度分别为67.03%、69.23%、67.03%、86.60%,特异度分别为75.47%、78.30%、78.30%、97.17%,约登指数分别为0.43、0.48、0.45、0.84,阳性似然比分别为2.73、3.19、3.09、30.60,阴性似然比分别为0.44、0.39、0.42、0.14,ROC曲线下面积分别为0.71、0.74、0.73、0.95,分类准确率分别为71.57%、74.11%、73.10%、94.92%,Kappa值分别为0.43、0.48、0.46、0.90,阳性预测值分别为70.11%、73.26%、72.62%、96.55%,阴性预测值分别为72.73%、74.77%、73.45%、93.64%。决策树模型与logistic回归模型、决策树模型与支持向量机模型之间的灵敏度差异具有统计学意义(P0.05),决策树模型与logistic回归模型、决策树模型与BP神经网络模型、决策树模型与支持向量机模型的特异度、准确率及ROC曲线下面积之间差异均具有统计学意义(P0.05)。针对测试集样本,logistic回归模型、BP神经网络模型、支持向量机模型及决策树模型的灵敏度分别为82.05%、82.05%、79.49%、84.62%,特异度分别为72.00%、68.00%、68.00%、76.00%,约登指数分别为0.55、0.50、0.47、0.61,阳性似然比分别为2.93、2.56、2.48、3.53,阴性似然比分别为0.25、0.26、0.30、0.20,ROC曲线下面积分别为0.77、0.73、0.76、0.80,分类准确率分别为76.40%、74.16%、73.03%、79.78%,Kappa值分别为0.53、0.49、0.46、0.60,阳性预测值分别为69.57%、66.67%、65.95%、73.33%,阴性预测值分别为83.72%、82.93%、80.95%、86.36%。四种模型灵敏度、特异度、准确率以及ROC曲线下面积之间差异没有统计学意义(P0.05)。4决策树模型对130例hypo-MDS患者进行鉴别分类时,将13例hypo-MDS患者错误分类为AA患者,通过对误判病例与正判病例的实验室检查指标比较发现,外周血细胞计数中误判病例的红细胞含量和血红蛋白含量高于正判病例,骨髓涂片中误判病例的成熟淋巴细胞比例高于正判病例,早幼红细胞比例及晚幼红细胞比例低于正判病例,差异有统计学意义(P0.05)。决策树模型对156例AA患者进行鉴别分类时,将15例AA患者错误分类为hypoMDS患者,通过对误判病例与正判病例的实验室检查指标比较发现,外周血细胞计数中误判病例的红细胞含量和血红蛋白含量低于正判病例,骨髓涂片中误判病例的早幼红细胞比例、中幼红细胞比例以及晚幼红细胞比例高于正判病例,而成熟淋巴细胞比例低于正判病例,差异有统计学意义(P0.05)。结论Logistic回归、决策树、BP神经网络及支持向量机四种分类算法中决策树算法对hypo-MDS与AA的分类效果最优,可以辅助临床医生对两种疾病进行鉴别诊断。
【图文】: 第 1 章 调查研究出现阳性结果的概率,则 logistic 回归模型可以表示为:1exp[()]10 1122qqXXXP+ β +β+β++β= 常数项,1β ,2β ,...,qβ 为回归系数。若用 I 表示 p 个:0112233I = β +βX+βX+ +βXP 之间的 logistic 曲线如下图:
的回归系数进行假设检验,以此来验证该回归系数是否有统计学意义。假设检验要包括两方面内容:一是对整个模型进行假设检验,,检验所有自变量的回归系数否不全为 0。通常采用似然比检验(likelihood ratio test);二是对单个回归系数行假设检验,检验自变量对应变量的影响是否真正存在,通常采用 Wald 检验[25]。(2)BP 神经网络人工神经网络是一种模拟人脑神经传递的智能算法,对资料类型没有任何求,具有良好的非线性处理能力、强大的容错性等优点,具有较高分类精确[26]。1974 年,哈佛大学的 Paul Werbos 发明 BP 算法,BP 算法核心的数学工具是微积分的链式求导法则[27]。BP 神经网络模型建立方法如下:设 X 为模型的输入神经元的输入,Y 为模的输出变神经元的输入,b 代表隐含层神经元的输入。给定如下训练集:{( )( ) ( )}lmdmmmD = X,Y,X,Y...,X,Y,X∈R,Y∈R1122, (11)以单隐层前馈网络为例,计算 BP 算法的推导过程如下:
【学位授予单位】:华北理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R551.3;R556.5
【参考文献】
相关期刊论文 前10条
1 董宝卫;王炯;赵永杰;;骨髓小粒细胞成分在贫血鉴别诊断的应用和分析[J];吉林医学;2015年18期
2 梁礼明;钟震;陈召阳;;支持向量机核函数选择研究与仿真[J];计算机工程与科学;2015年06期
3 黄俊;邓明凤;陈永玲;唐元艳;黄知平;;低增生性骨髓增生异常综合征与再生障碍性贫血的检查诊断[J];中国卫生检验杂志;2014年16期
4 闫振宇;田旭;李莹;杨美荣;张嵩;王雪明;张海霞;陈乃耀;;MDS与AA患者骨髓CD34~+和CD71~+CD45~-细胞水平的变化[J];中国实验血液学杂志;2014年02期
5 肖辉;周征奇;肖革新;于石成;;公共卫生领域中的数据挖掘[J];医学信息学杂志;2013年12期
6 李雯雯;王增胜;王晓敏;李燕;毛敏;张晓燕;艾合买提江·艾斯木吐拉;;骨髓增生异常综合征患者淋巴细胞亚群特点及环孢素对其的影响[J];白血病.淋巴瘤;2013年11期
7 王梦雪;;数据挖掘综述[J];软件导刊;2013年10期
8 石晓敬;;数据挖掘及其在医学信息中的应用[J];医学信息学杂志;2013年05期
9 高汉松;肖凌;许德玮;桑梓勤;;基于云计算的医疗大数据挖掘平台[J];医学信息学杂志;2013年05期
10 许永波;姜珏;周琦;余姗姗;魏亚娟;乞艳华;雷小莹;;Logistic回归模型评价超声造影在甲状腺单发结节中的鉴别诊断价值[J];中国超声医学杂志;2013年04期
相关硕士学位论文 前8条
1 王潇;血管性认知障碍影响因素的决策树模型研究[D];青岛大学;2017年
2 张翔;数据挖掘决策树在结直肠癌预后预测中的研究与应用[D];福建医科大学;2016年
3 李锦绣;基于Logistic回归模型和支持向量机(SVM)模型的多分类研究[D];华中师范大学;2014年
4 宋健;Logistic回归模型、神经网络模型和决策树模型在肺癌术后心肺并发症预测中的比较[D];安徽医科大学;2014年
5 黄雯;数据挖掘算法及其应用研究[D];南京邮电大学;2013年
6 王旭;低增生性骨髓增生异常综合征与再生障碍性贫血的临床比较[D];吉林大学;2007年
7 王晶;支持向量机及其在癌症诊断中的应用研究[D];东北师范大学;2006年
8 李欣;基于神经网络的数据挖掘方法研究[D];大庆石油学院;2003年
本文编号:
2671187
本文链接:https://www.wllwen.com/yixuelunwen/xxg/2671187.html