基于BP神经网络和随机森林算法的冠状动脉狭窄风险识别模型研究
发布时间:2020-04-14 16:54
【摘要】:目的:冠心病是由冠状动脉血管狭窄所致心肌缺血缺氧的一种心血管疾病,其预后情况复杂多变。冠心病已然成为当前威胁人类生命健康的重要原因。冠状动脉造影手术治疗是目前唯一可以直接观察冠状动脉形态的论断方法,被认为是当前诊断冠心病的“金标准”,但由于冠状动脉造影存在创伤性,禁忌症和术后并发症,费用昂贵等诸多缺点,无法开展大规模的人群筛查,因此针对冠心病患者,构建冠状动脉狭窄早期风险识别模型显得尤为重要。本研究基于冠心病心衰患者临床病历资料,构建冠脉狭窄早期风险识别模型,实现高效、无创的识别冠状动脉狭窄,以指导临床医生和患者选择合理的预防性治疗和干预措施,以期降低冠状动脉狭窄的发生率和致死率。方法:根据本课题研究对象的纳入和排除标准,共筛选出符合条件的山西省心血管病医院和山西医科大学第一医院心内科2011年10月至2018年5月期间确诊为冠心病心衰的2926例住院患者作为本研究的研究对象,通过查阅两所医院病案室中相关电子和纸质病历,获取患者的一般人口学资料、既往史、实验室检查、心电图、心脏彩超、冠脉造影、用药等信息。利用卡方检验和基于秩的非参数检验从上述资料中筛选出与冠状动脉狭窄有关的变量。采用分层抽样的方法从冠脉造影手术结果Gensini评分大于等于4的患者和Gensini评分小于4的患者(包括未行冠脉造影手术的患者)两种数据资料中分别抽取四分之三样本作为训练数据集,该部分数据用于训练初始模型,将剩余四分之一样本作为测试数据集,用来评价各模型的分类效果。将从病历资料中筛选出的变量作为输入变量,将冠脉造影手术结果Gensini评分是否大于4作为结局变量,在训练数据集中分别建立logistic回归、BP神经网络和随机森林分类识别模型,在测试数据集中通过准确度、灵敏度、特异度、阳性预测值、阴性预测值和受试者工作特征曲线下面积AUC指标来评价和比较三种模型的综合性能。结果:通过单因素检验(卡方检验和基于秩的非参数检验),从147个变量中初步筛选出与冠状动脉狭窄相关的变量共49个,其中包括心律失常、高血压、血红蛋白、血小板等。通过基于AUC的随机森林自变量筛选方法对上述单因素检验得到的变量进行进一步筛选,最终获得36个变量进入最终模型进行训练。将36个变量作为模型的输入变量,用来训练logistic回归、BP神经网络和随机森林的初始模型。logistic回归模型在测试数据集中的结果:灵敏度为75.76%,特异度为72.95%,准确度为74.05%,阳性预测值为73.95%,阴性预测值为72.07%,AUC值为0.7399。训练BP神经网络之前,首先通过模拟试验,确定隐含层个数,实验结果发现,当神经网络模型的隐含层个数为25时,模型误差相对较小,因此构建模型结构为36-25-1的神经网络模型,BP神经网络模型在测试数据集中的结果:灵敏度为74.30%,特异度为70.00%,准确度为72.30%,阳性预测值为75.05%,阴性预测值为69.18%,AUC值为0.7231。在训练随机森林模型之前,首先对模型参数mtry和ntree进行选择,结果发现,当参数mtry设置为3,ntree设置为1000时,模型性能达到最佳,测试数据集中,随机森林模型的模型效果:灵敏度为93.70%,特异度为62.97%,准确度为79.49%,阳性预测值为74.58%,阴性预测值为89.39%,AUC值为0.7522。结论:随机森林模型在冠状动脉狭窄程度识别中的综合性能最佳,可以在患者发病早期,实现对冠状动脉狭窄的识别,这使得冠状动脉狭窄的发生概率被估计的更加准确,在临床上为医生和患者提供更加精确和高效的意见和建议,对提高诊疗质量具有重要意义。
【图文】:
图 1-1 神经网络简图可以看出,神经网络[27]主要可以分为以下三部分:网络结构、初始活函数。根据不同的网络结构,可将神经网络分为几种不同的类的类型有前馈型神经网络和反馈型神经网络两种,常见的 BP 神经神经网络,Hopfield 神经网络[28]是反馈网络中最简单且应用最广用中较为常见神经网络模型为 BP 神经网络,它的主要思想[29]是利估计输出层前一层的误差,,再用该层误差来估计更前一层误差,如估计,这里的误差估计可以理解为某种偏导数,我们就是根据这种的连接权值,再用调整后的连接权值重新计算输出误差,直到输出要求或者迭代次数溢出设定值。森林(Random forests,RF)林算法是一种基于决策树的集成学习方法,它最早是由 Breiman
图 2-1 模型入选自变量重要性比较根据上述自变量的重要性排序结果,将MDG指标较小的几个变量进行后向其他变量来参与模型重建,所得模型 AUC 值(即 OOB-AUC)的变化趋势示。
【学位授予单位】:山西医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP183;R541.4
【图文】:
图 1-1 神经网络简图可以看出,神经网络[27]主要可以分为以下三部分:网络结构、初始活函数。根据不同的网络结构,可将神经网络分为几种不同的类的类型有前馈型神经网络和反馈型神经网络两种,常见的 BP 神经神经网络,Hopfield 神经网络[28]是反馈网络中最简单且应用最广用中较为常见神经网络模型为 BP 神经网络,它的主要思想[29]是利估计输出层前一层的误差,,再用该层误差来估计更前一层误差,如估计,这里的误差估计可以理解为某种偏导数,我们就是根据这种的连接权值,再用调整后的连接权值重新计算输出误差,直到输出要求或者迭代次数溢出设定值。森林(Random forests,RF)林算法是一种基于决策树的集成学习方法,它最早是由 Breiman
图 2-1 模型入选自变量重要性比较根据上述自变量的重要性排序结果,将MDG指标较小的几个变量进行后向其他变量来参与模型重建,所得模型 AUC 值(即 OOB-AUC)的变化趋势示。
【学位授予单位】:山西医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP183;R541.4
【相似文献】
相关期刊论文 前10条
1 沈智勇;苏
本文编号:2627503
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2627503.html