当前位置:主页 > 医学论文 > 心血管论文 >

基于集成特征选择的冠心病筛查模型研究

发布时间:2020-05-06 15:28
【摘要】:心血管疾病是一种严重威胁人类健康的重大疾病。冠心病作为一种常见的心血管疾病,其发病率和死亡率逐年上升,同时其昂贵的治疗费用给国家和人民带来了巨大的经济负担,给患者家庭带来了巨大的灾难。冠状动脉造影是近几年常用的有创诊断技术,被认为是诊断冠心病的“金标准”,然而其费用较为昂贵,且对做操作者的技术水平要求较高,不适用于冠心病早期的筛查和诊断。因此,研发普适的冠心病早期无损筛查诊断方法,对于降低冠心病的发病率和死亡率具有重大意义。本文首先对国内外冠心病危险因素及其筛查模型的研究现状和发展趋势进行了系统综述,然后利用多种特征选择方法筛选冠心病危险因素,并对冠心病的早期无损筛查模型的构建进行了系统研究。完成的主要创新性工作如下:(1)在某三级甲等医院心内科完成冠心病组和对照组数据的采集,并构建山东地区冠心病危险因素数据库。构建的数据库涵盖的主要信息包括:临床症状、生化指标、人口学信息、生活习惯、个人疾病史、家族疾病史、心电检查结果等信息。(2)提出一种集成多种特征选择方法的特征选择策略。首先利用方差分析、卡方检验、互信息、循环递归消除、随机森林特征权重系数、支持向量机特征权重系数和XGB(Extreme Gradient Boosting,XGB)特征权重系数七种特征选择方法,对上述特征集完成特征重要性评估,筛选出重要的特征;然后,对筛选的特征投票,统计每个特征所得的票数,票数相同的特征构成新的特征集;最后,新特征集分别用支持向量机构建模型,通过模型性能指标得出最重要的特征集。(3)筛选的重要特征基于支持向量机构建了冠心病筛查模型。模型的准确性、敏感性和F1-measure分别达到了89.39%、94.53%、90.68%。与使用原特征集训练的模型、单一特征选择方法训练的模型相比,集成特征选择方法训练的模型准确性分别提高了9%和3.3%。该方法训练的模型能有效识别冠心病,可为临床上冠心病的筛查和诊断提供参考。
【图文】:

主要疾病,中国城市居民,死亡率,年份


1990邋*邋995邋2000邋2005邋2006邋2007邋2008邋2009邋2010邋2011邋2012邋2013邋2014邋2015邋2016逡逑年份《年}逡逑图1-1邋1990-2016中国农村居民主要疾病死亡率变化⑴逡逑300邋?逡逑265邋265.11逡逑255邋254邋257邋252逦__?逡逑250.逦230邋234逦 ̄ ̄逦逡逑一逦一??心血管病逡逑S邋200'逦+舯描逡逑|邋150-逦、'一"?."*■***、一?逦*■逦■逡逑一一咖中匌逡逑100-邋*__*逡逑50邋?逡逑i逦-逦n逦0逦,逦_逦_逦?:逡逑%逦逦,邋_邋t邋r邋f邋t邋t逡逑0'逦*逦...........逦i逦.逦■逡逑1990邋1995邋2000邋2005邋2006邋2007邋2008邋2009邋2010邋2011邋2012邋2013邋2014邋2015邋2016逡逑年份(年>逡逑图1-2邋1990-2016中国城市居民主要疾病死亡率变化逡逑2逡逑

流程图,交叉验证,模型构建,流程


解决上述问题的有效方法是通过K折交叉验证(K-fold邋cross邋validation)邋[65]逡逑来评估和验证模型的性能。K折交叉验证是一种典型的交叉验证的方法,,其流程逡逑如图3-1所示,先把数据分成k等份,选其中K-1份作训练集训练模型,剩下一逡逑份作测试集验证模型,该过程被重复K次,得到K次测试结果,再取平均值,逡逑即为模型的性能指标。该方法保证了测试集不参与模型训练和参数选择,同时有逡逑效利用了所有数据,使模型性能评估更客观准确。本论文的实验使用十折交叉验逡逑证了模型的泛化能力。逡逑数据集逡逑逦邋逦逡逑逦逦逦逡逑第1轮|邋训练集逦测试集测试结果1、逡逑第2轮逦训练集邋测试集训练集测试结果2逦^邋^逡逑1逦^1逦s6返回结果逡逑*邋*邋?逡逑第k轮测试集逦训练集逦1逦)测试结果1^逡逑图3-1邋K折交叉验证流程图逡逑3.1.4模型构建流程逡逑第二章的数据库基于SVM构建了冠心病筛查模型,模型训练过程中应用十逡逑折交叉验证将数据分成训练集和测试集,训练集基于网格搜索策略寻找最优参数逡逑训练最优模型,测试集用于验证模型的性能。构建流程如图3-2所示。逡逑19逡逑
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP311.13;R541.4

【相似文献】

相关期刊论文 前10条

1 张红涛,胡玉霞,邱道尹;遗传算法在储粮害虫特征选择中的应用[J];华北水利水电学院学报;2004年03期

2 徐雷;阎平凡;常迥;;用于特征选择的BF算法及其与B&B算法的比较[J];自动化学报;1988年05期

3 杨锦英;王碧泉;;K—W检验和熵法在单个特征选择中的应用[J];华北地震科学;1989年02期

4 陈晋苏;特征选择在电信行业客户流失分析中的应用[J];科技资讯;2005年22期

5 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期

6 江乃雄;蔡民;;综合距离特征选择问题解的存在性与唯一性[J];计算机应用与软件;1992年01期

7 钱学双;多重筛选逐步回归特征选择法及其应用[J];信息与控制;1986年05期

8 赵帅;张雁;徐海峰;;基于成对约束分的特征选择及稳定性评价[J];计算机与数字工程;2019年06期

9 余胜龙;赵红;;基于样本邻域保持的代价敏感特征选择[J];数据采集与处理;2018年02期

10 杜政霖;李云;;基于特征聚类集成技术的在线特征选择[J];计算机应用;2017年03期

相关会议论文 前10条

1 史彩娟;沙宇阳;刘健;闫晓东;刘利平;;基于自适应半监督稀疏特征选择的图像标注[A];第十届全国信号和智能信息处理与应用学术会议专刊[C];2016年

2 刘培磊;李满生;王挺;;蛋白质相互作用有向关系抽取的特征选择[A];第五届全国信息检索学术会议论文集[C];2009年

3 袁帅;杨宏晖;申f;;基于云模型的特征评价准则[A];第三届上海——西安声学学会学术会议论文集[C];2013年

4 申f;杨宏晖;袁帅;;用于水声目标识别的互信息无监督特征选择[A];第三届上海——西安声学学会学术会议论文集[C];2013年

5 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年

6 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年

7 宋鹏;郑文明;赵力;;基于子空间学习和特征选择融合的语音情感识别[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年

8 臧淼;徐惠民;张永梅;;基于局部约束和稀疏编码的自动图像标注[A];国防光电子论坛第二届激光雷达成像探测技术及应用研讨会论文集[C];2015年

9 俞士汶;王治敏;朱学锋;;文学语言与自然语言理解研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

10 薛富强;葛临东;陈丽;;新的改进遗传算法用于调制信号特征选择[A];无线传感器网及网络信息处理技术——2006年通信理论与信号处理年会论文集[C];2006年

相关重要报纸文章 前7条

1 本报记者 李振辉;根据自身特征选择健身方式[N];广东科技报;2008年

2 海通证券 娄静邋吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年

3 铁岭市第二高中 高军;让学生“动”起来[N];铁岭日报;2005年

4 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年

5 《网络世界》记者 周源;云平台,只选对的[N];网络世界;2012年

6 郑军;高产鹅选种方法和标准[N];河南科技报;2016年

7 记者 丁宁;2012年,我们一起“追”的创新产品[N];上海证券报;2012年

相关博士学位论文 前10条

1 袁明冬;基于图的特征提取和特征选择及其应用研究[D];西安电子科技大学;2017年

2 胡小娟;基于特征选择的文本分类方法研究[D];吉林大学;2018年

3 任宇林;结构化预测中N元特征选择算法的研究[D];华中科技大学;2018年

4 Reehan Ali Shah;基于稀疏模型组合的网络入侵分类[D];浙江大学;2019年

5 滕旭阳;面向特征选择问题的优化方法研究[D];哈尔滨工程大学;2017年

6 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年

7 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年

8 刘风;基于磁共振成像的多变量模式分析方法学与应用研究[D];电子科技大学;2014年

9 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年

10 梁建宁;特征选择与图像匹配[D];复旦大学;2011年

相关硕士学位论文 前10条

1 侯宇亮;基于极限学习机的分类方法研究及应用[D];中原工学院;2019年

2 尹春燕;基于集成特征选择的冠心病筛查模型研究[D];山东大学;2019年

3 薛瑞;转子故障诊断中的特征选择问题研究[D];兰州理工大学;2019年

4 周雨;基于互信息与决策树的特征选择[D];兰州大学;2019年

5 余思成;基于特征选择的集成分类方法及其应用研究[D];江苏科技大学;2019年

6 Wei Wang;P值的不稳定性与其他因素对统计特征选择的影响[D];天津大学;2018年

7 游仁春;基于特征选择聚类和张量分析的碳纤维增强复合材料超声缺陷识别[D];厦门大学;2017年

8 闫文凯;基于特征选择的致病SNP识别方法研究[D];南京农业大学;2017年

9 周至;复杂环境下无人工干预的室内定位算法研究[D];南京大学;2019年

10 马必焕;一种多任务特征选择金字塔及其在电力设备检测的应用[D];浙江大学;2019年



本文编号:2651485

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/xxg/2651485.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户20ddc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com