基于组合分类器的肾病风险预测的应用研究

发布时间：2020-08-31 21:13

　　在中国特色社会主义新时代,提高人们的生活水平、保障人民就医便捷和增长人均寿命时间的关键不仅在于医疗队伍的强大还在于医疗技术的发展与创新。研究一个可靠实用且性能良好的肾病风险预测系统,对疾病的早期预防控制的具有十分现实的意义。风险预测是一个较为复杂的决策性过程,在单分类器预测性能不够好的基础上,选择用组合分类器的方法进行风险预测。组合分类器能有效的提高风险预测系统的应用泛化能力,近几年也得到了众多学者们的广泛关注。在收集了近12806条肾病原始数据,经过数据预处理和数据规范后,共选取了10000条有效数据,建立了肾病风险预测数据库的基础上。应用支持向量机算法(SVM)、BP神经网络分类算法(BP)、决策树分类算法(C4.5)、贝叶斯分类算法(Bayes)等四个单分类器算法的建模研究后,利用Adaboost、Bagging、Stacking等组合分类器的算法对数据进行进一步的分类预测。证实了在肾病数据基础上,组合分类器的性能要比单个分类器的性能好。所做主要工作如下:1、介绍了肾病风险预测的产生的背景、实用价值和应用前景,研究了肾病风险预测在国内外研究现状和主要研究内容。2、研究了机器学习的主要方法,主要有支持向量机分类算法、C4.5决策树分类算法、朴素贝叶斯分类算法、BP神经网络分类算法、Adaboost算法、Bagging算法、Stacking算法,分别对算法概念、算法原理、算法步骤和典型应用进行了阐述。3、对收集的肾病数据进行清洗、特征选取、特征降维、对肾病检查值的单位及取值范围进行规范。建设肾病风险预测系统,具备对数据的基本操作功能和模型建立与风险预测功能。4、对模型进行对比评价,通过风险预测系统结果分析,验证已有的肾病风险预测理论,探索发现新的肾病风险预测结论,指导进一步实验研究和临床诊疗。
【学位单位】：南京中医药大学
【学位级别】：硕士
【学位年份】：2019
【中图分类】：TP181;R692
【部分图文】：

维特,属性特征,主成分,原始数据

Ｐ：ｒｗｉ？ｓ＾？ｐ｜ｉＪ邋Ｏ＾ｒｉｒｉｐａｒＨ＾ｉｌ逡逑图３－２邋ＰＣＡ分析结果１０维逡逑从图３－２中可以得出，当纵坐标累计方差Ｇ（ｍ）在９５％时，横坐标上的主成分显示１０维特征就可逡逑以很好的表示原始数据的属性特征。在实验中，不断尝试设定累计误差Ｇ（ｍ）的值为８５％、９０％、９５％逡逑等，得到当选择９５％这个阈值使得测试集的分类最为准确。逡逑３．４基于单分类器的肾病凤险预测模型逡逑３．４．１支持向量机分类模型逡逑ＳＶＭ分类器建模过程：实验数据来源于南京某总院肾脏科门诊和住院数据，共１２８０６逡逑条数据，经处理后得有效数据共有１００００条，按照４：１的比例选取训练集和测试集。因此逡逑选择８０００条作为训练样本，用来构建分类器模型。２０００条作为测试样本，用来检验分类逡逑器的准确率。在ＳＶＭ领域中核函数的选择是一个特别重要的分支，论文中采用什么样的逡逑核函数适用于训练数据并使得建立的ＳＶＭ分类器的准确率最高，是研究的重点。因此需逡逑要将上一章提到的多项式核函数、高斯核函数、Ｓｉｇｍｏｉｄ核函数以及ＲＢＦ核函数逐一用于逡逑分类器的建模

数据操作,首页,界面,风险预测

数据修改｜邋Ｈ模型删除｜逦Ｈ

本文编号：2809330

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/yixuelunwen/mjlw/2809330.html

上一篇：肾嫌色细胞癌术后复发伴转移一例及文献回顾
下一篇：新乡市区代谢综合征与泌尿系结石关系的临床研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|