面向复杂因素的心血管疾病预测研究
本文选题:心血管疾病 + CVD ; 参考:《郑州大学》2017年硕士论文
【摘要】:心血管疾病(Cardiovascular disease,CVD)作为城乡居民健康的头号杀手,在基层社区对CVD进行初筛需求强烈。通过CVD风险预测制定针对性的干预措施,能有效降低发病率,其中核心的技术环节是建立准确性高的预测模型。经济社会发展推动人们生活方式和环境的快速变化,使得CVD危险因素变得复杂,建立新的面向复杂因素的CVD预测模型具有重要应用价值和现实意义。传统的CVD预测用Logistic回归、Cox回归等数理预测法建立公式化的预测模型,受公式的线性拟合能力约束,纳入的因素均为连续型和二分类变量,以非线性数据表述的多分类复杂因素不能适用。而复杂因素中可能包含了重要的潜在信息,对准确地预测CVD贡献较大。神经网络在非线性数据处理中的学习能力、适应能力较强,为解决上述问题提供了思路。以实现面向复杂因素的CVD预测为目标,首先分析回归模型无法面向复杂因素进行CVD预测的具体原因,利用哑变量将复杂因素线性化解决该问题;其次利用浅层神经网络将非线性的复杂因素映射到高维空间进行线性的回归拟合,以实现面向复杂因素的CVD预测,并研究提高模型的AUC(The area under ROC curve)值;最后设计基于深度学习的CVD预测,利用无监督学习改善浅层神经网络参数的初始化策略,降低预测结果的方差值。主要研究工作及结果如下:(1)从模型机理上分析回归模型对复杂因素不适用的原因,采用对复杂因素设置哑变量的方法应用回归模型。实验以Logistic回归为例,包含复杂因素条件下,改进模型的AUC值由Logistic的0.7634、0.6700提升到了0.8784、0.7999,符合传统回归模型的0.78~0.86,表明回归模型不能直接纳入复杂因素。(2)针对CVD复杂因素数据的非线性特征,建立基于浅层神经网络的CVD预测模型,并通过改进网络参数的初始值提高模型预测的准确性。实验结果显示,模型的平均AUC值提高到了0.9024、0.8423。(3)利用深度学习逐层提高CVD数据特征的表达能力,以学习到的最优参数初始化神经网络,解决神经网络参数随机初始化导致的预测不稳定问题,降低预测结果的方差值,提高模型的预测稳定性。实验结果显示,模型的预测结果方差由12.665、9.051降为5.723、4.642,AUC值进一步提高到0.9198、0.8959。
[Abstract]:Cardiovascular disease (CVD), as the leading killer of urban and rural residents' health, has a strong demand for primary screening of CVD in grass-roots communities.It is effective to reduce the incidence of CVD risk by making relevant intervention measures, among which the key technique is to set up accurate prediction model.The development of economy and society promotes the rapid change of people's life style and environment, and makes the risk factors of CVD become more complicated. It is of great value and practical significance to establish a new CVD prediction model for complex factors.The traditional CVD prediction model is formulated by Logistic regression and Cox regression, which is constrained by the linear fitting ability of the formula, and the factors included are continuous and binary variables.Multi-classification complex factors expressed by nonlinear data cannot be applied.Complex factors may contain important potential information and contribute greatly to accurate prediction of CVD.The learning ability and adaptability of neural network in nonlinear data processing is strong, which provides a way to solve the above problems.In order to realize the CVD prediction for complex factors, firstly, the specific reasons why the regression model can not predict CVD for complex factors are analyzed, and the complex factors are linearized by dummy variables to solve the problem.Secondly, the shallow neural network is used to map the nonlinear complex factors to the high-dimensional space for linear regression fitting to realize the CVD prediction for complex factors, and to improve the AUC(The area under ROC curvevalue of the model.Finally, CVD prediction based on deep learning is designed to improve the initialization strategy of shallow neural network parameters by using unsupervised learning to reduce the square difference of prediction results.The main research work and results are as follows: (1) the reason why the regression model is not applicable to complex factors is analyzed from the model mechanism, and the method of setting mute variables for complex factors is used to apply the regression model.The experiment takes Logistic regression as an example, under the condition of complex factors,The AUC value of the improved model was raised from 0.7634 / 0.6700 of Logistic to 0.8784 / 0.7999, which is in line with the traditional regression model's 0.780.86, which indicates that the regression model can not directly incorporate the complex factors. (2) aiming at the nonlinear characteristics of CVD complex factor data, a CVD prediction model based on shallow neural network is established.The accuracy of model prediction is improved by improving the initial value of network parameters.The experimental results show that the average AUC value of the model is increased to 0.9024 and 0.8423.3) the expression ability of CVD data features is improved layer by layer by depth learning, and the neural network is initialized with the optimal parameters.The problem of prediction instability caused by random initialization of neural network parameters is solved, the square difference of prediction results is reduced, and the prediction stability of the model is improved.The experimental results show that the variance of the predicted results of the model decreased from 12.665U 9.051 to 5.723N4.642AUC further increased to 0.9198N0.8959.
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R54;O212.1
【相似文献】
相关期刊论文 前10条
1 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
2 刘彩红;唐万梅;;基于组合神经网络的教师评价模型研究[J];重庆师范大学学报(自然科学版);2008年04期
3 钟义信;;神经网络:成就、问题与前景[J];科学;1992年02期
4 莫恭佑;;神经网络及其在英国的应用[J];国际科技交流;1992年03期
5 闵志;;神经网络:使计算机具有快速学习功能[J];国际科技交流;1992年03期
6 冯建峰,钱敏平;神经网络中的退火——非时齐情形[J];北京大学学报(自然科学版);1993年03期
7 唐功友;离散Hopfield神经网络的稳定性[J];青岛海洋大学学报;1994年S2期
8 靳蕃;;中国神经网络学术大会在西南交通大学隆重召开[J];学术动态报道;1996年04期
9 彭宏,张素;带有时滞的神经网络的稳定性[J];杭州大学学报(自然科学版);1997年04期
10 陈新,孙道恒,黄洪钟;结构分析有限元系统与神经网络[J];起重运输机械;1999年06期
相关会议论文 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 北京安贞医院心内科副主任医师 乔岩;消极情绪易致心血管疾病[N];保健时报;2014年
3 记者 吴平;心血管疾病人类主要杀手?[N];新华每日电讯;2001年
4 高原;压力过大会显著增加患心血管疾病风险[N];中国中医药报;2008年
5 记者 卞晨光;心血管疾病仍是人类死亡首要原因[N];科技日报;2008年
6 记者 蒋秀娟;中青年是心血管疾病重点预防人群[N];科技日报;2009年
7 记者 李天舒;华裔心血管疾病相对低发[N];健康报;2010年
8 刘涛;我市心血管疾病发病呈年轻化趋势[N];太原日报;2010年
9 记者 刘海英;飞机噪音或增加患心血管疾病风险[N];科技日报;2013年
10 记者 田雅婷;我国每10秒有一人死于心血管疾病[N];光明日报;2014年
相关博士学位论文 前10条
1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年
相关硕士学位论文 前10条
1 李奇航;面向复杂因素的心血管疾病预测研究[D];郑州大学;2017年
2 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年
3 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年
4 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年
5 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
6 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年
7 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年
8 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年
9 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
10 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
,本文编号:1747536
本文链接:https://www.wllwen.com/kejilunwen/yysx/1747536.html