基于组合分类器的肾病风险预测的应用研究
发布时间:2020-08-31 21:13
在中国特色社会主义新时代,提高人们的生活水平、保障人民就医便捷和增长人均寿命时间的关键不仅在于医疗队伍的强大还在于医疗技术的发展与创新。研究一个可靠实用且性能良好的肾病风险预测系统,对疾病的早期预防控制的具有十分现实的意义。风险预测是一个较为复杂的决策性过程,在单分类器预测性能不够好的基础上,选择用组合分类器的方法进行风险预测。组合分类器能有效的提高风险预测系统的应用泛化能力,近几年也得到了众多学者们的广泛关注。在收集了近12806条肾病原始数据,经过数据预处理和数据规范后,共选取了10000条有效数据,建立了肾病风险预测数据库的基础上。应用支持向量机算法(SVM)、BP神经网络分类算法(BP)、决策树分类算法(C4.5)、贝叶斯分类算法(Bayes)等四个单分类器算法的建模研究后,利用Adaboost、Bagging、Stacking等组合分类器的算法对数据进行进一步的分类预测。证实了在肾病数据基础上,组合分类器的性能要比单个分类器的性能好。所做主要工作如下:1、介绍了肾病风险预测的产生的背景、实用价值和应用前景,研究了肾病风险预测在国内外研究现状和主要研究内容。2、研究了机器学习的主要方法,主要有支持向量机分类算法、C4.5决策树分类算法、朴素贝叶斯分类算法、BP神经网络分类算法、Adaboost算法、Bagging算法、Stacking算法,分别对算法概念、算法原理、算法步骤和典型应用进行了阐述。3、对收集的肾病数据进行清洗、特征选取、特征降维、对肾病检查值的单位及取值范围进行规范。建设肾病风险预测系统,具备对数据的基本操作功能和模型建立与风险预测功能。4、对模型进行对比评价,通过风险预测系统结果分析,验证已有的肾病风险预测理论,探索发现新的肾病风险预测结论,指导进一步实验研究和临床诊疗。
【学位单位】:南京中医药大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP181;R692
【部分图文】:
P:rwi?s^?p|iJ邋O^ririparH^il逡逑图3-2邋PCA分析结果10维逡逑从图3-2中可以得出,当纵坐标累计方差G(m)在95%时,横坐标上的主成分显示10维特征就可逡逑以很好的表示原始数据的属性特征。在实验中,不断尝试设定累计误差G(m)的值为85%、90%、95%逡逑等,得到当选择95%这个阈值使得测试集的分类最为准确。逡逑3.4基于单分类器的肾病凤险预测模型逡逑3.4.1支持向量机分类模型逡逑SVM分类器建模过程:实验数据来源于南京某总院肾脏科门诊和住院数据,共12806逡逑条数据,经处理后得有效数据共有10000条,按照4:1的比例选取训练集和测试集。因此逡逑选择8000条作为训练样本,用来构建分类器模型。2000条作为测试样本,用来检验分类逡逑器的准确率。在SVM领域中核函数的选择是一个特别重要的分支,论文中采用什么样的逡逑核函数适用于训练数据并使得建立的SVM分类器的准确率最高,是研究的重点。因此需逡逑要将上一章提到的多项式核函数、高斯核函数、Sigmoid核函数以及RBF核函数逐一用于逡逑分类器的建模
数据修改|邋H模型删除|逦H
本文编号:2809330
【学位单位】:南京中医药大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP181;R692
【部分图文】:
P:rwi?s^?p|iJ邋O^ririparH^il逡逑图3-2邋PCA分析结果10维逡逑从图3-2中可以得出,当纵坐标累计方差G(m)在95%时,横坐标上的主成分显示10维特征就可逡逑以很好的表示原始数据的属性特征。在实验中,不断尝试设定累计误差G(m)的值为85%、90%、95%逡逑等,得到当选择95%这个阈值使得测试集的分类最为准确。逡逑3.4基于单分类器的肾病凤险预测模型逡逑3.4.1支持向量机分类模型逡逑SVM分类器建模过程:实验数据来源于南京某总院肾脏科门诊和住院数据,共12806逡逑条数据,经处理后得有效数据共有10000条,按照4:1的比例选取训练集和测试集。因此逡逑选择8000条作为训练样本,用来构建分类器模型。2000条作为测试样本,用来检验分类逡逑器的准确率。在SVM领域中核函数的选择是一个特别重要的分支,论文中采用什么样的逡逑核函数适用于训练数据并使得建立的SVM分类器的准确率最高,是研究的重点。因此需逡逑要将上一章提到的多项式核函数、高斯核函数、Sigmoid核函数以及RBF核函数逐一用于逡逑分类器的建模
数据修改|邋H模型删除|逦H
本文编号:2809330
本文链接:https://www.wllwen.com/yixuelunwen/mjlw/2809330.html
最近更新
教材专著