基于特征提取的肝癌患者乙肝病毒再激活的分类预测
【学位单位】:齐鲁工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:R735.7;TP181
【部分图文】:
齐鲁工业大学硕士学位论文的危险因素子集,使用支持向量机进行分类预测时,预测精度最高,灵敏性和异性也都高于其他组合。因此我们把两种方法选出的特征子集规模为 5 时的特作为最优的危险因素组合,顺序选择算法找到的危险因素组合有交集但不完全同,为验证交集中的危险因素是否有冗余信息,又用 PCA 对这些危险因素进行析。.4.3 基于主成分分析的特征处理将上面前向选择和后向选择方法选出的危险因素组合求并集,即将“HBVNA 水平、外放边界、AFP、放疗次数、分割方式、KPS 评分、TNM 肿瘤分期和效生物剂量”作为顺序选择算法找到的总的危险因素子集,通过主成分分析法证 8 个特征中是否有冗余信息。根据实验将这 8 个特征的贡献率绘制成直方图。
图 4.3 原始特征集中每个特征的重要性从上图可以看出 28 个特征的重要性数值相差悬殊,重要性值有正有负,没有律,因此并非所有特征都是有用的。一般认为特征重要性值为正代表有用信息,为负的,代表冗余信息,我们认为是噪声。为便于分析,将重要性值大于 0.1 的征统计进行排序,然后整理成表格 4.9。表 4.9 重要性大于 0.1 的特征特征编号 对应的特征 重要度7 Child-Pugh 0.1223 V30 0.1316 PTV 体积 0.1422 V25 0.1525 V40 0.1726 V45 0.18
图 4.4 不同层数下的小波变换图形从图 4.4 小波变换后的波形图中可以看出,原始特征集小波变换图的奇异点不突出,第三层小波波形图中奇异点的变化相对较明显。对比表 4.8 中的分类结果可以得出:对原始数据进行小波变化后,当选取小波变换后的第 3 层数据作为处理后的数据,然后通过随机森林选出 5 个关键特征建立的随机森林分类模型是最佳的分类预测模型。将小波层次固定为 3,对经小波处理后的数据和未经小波处理的数据进行随机森林分类,分类结果如表 4.11 所示。表 4.11 小波处理后的分类结果特征集 处理方法 正确率 灵敏性 特异性原始特征集无 77.88% 98.80% 4.7%小波变换 78.88% 98.28% 6.5%等效生物计量、HBV DNA 水平、KPS 评分、无 80.27% 95.14% 30.17%
【相似文献】
相关期刊论文 前10条
1 宋维康;徐冰;;煤与瓦斯突出分类预测方法分析[J];煤;2016年04期
2 李倩倩;姜景;李瑛;刘怡君;;我国政务微博转发规模分类预测[J];情报杂志;2018年01期
3 路小娟;朱正平;;太阳能光伏发电量分类预测研究[J];自动化与仪器仪表;2016年01期
4 陆桂明;张源;周志敏;;基于机器学习的贫困生分类预测研究[J];计算机应用与软件;2019年01期
5 屈玉涛;邓万宇;;基于matlab的svm分类预测实现[J];信息通信;2017年03期
6 王与;刘洋;;分类技术在高校教学管理中的应用[J];滁州学院学报;2011年05期
7 莫世华,俞敏;霍乱发病地区分类预测方法研究[J];浙江预防医学;1999年10期
8 马寅午,周晓阳,尚金成,张勇传,顾宁昌,刘丹雅,谭培伦;防洪系统洪水分类预测优化调度方法[J];水利学报;1997年04期
9 陈晖;胡泽根;李云鹏;葛丽珍;李彦来;;自组织神经网络技术在新油田快速评价中的应用[J];重庆科技学院学报(自然科学版);2017年02期
10 叶奇明;罗飞;刘娟;;基于多目标EDA的特征基因选择[J];计算机应用研究;2009年08期
相关会议论文 前3条
1 沈杰;李卫华;唐峗;;一种基于化合物子结构模式识别的分类预测方法[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
2 孙蕾;罗建书;;基于分类预测的高光谱遥感图像无损压缩[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 罗三华;黄建华;邱建丁;;小波支持向量机在蛋白质二级结构分类预测中应用[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
相关博士学位论文 前4条
1 刘惠;蛋白质序列数据的分类预测研究[D];上海交通大学;2007年
2 王立鹏;特征提取及分类算法在膜蛋白分类预测问题中的应用[D];兰州理工大学;2010年
3 廖志芳;大肠早癌辅助诊断数据挖掘方法研究[D];中南大学;2008年
4 王彤;高维生物数据的分类与预测研究[D];上海交通大学;2009年
相关硕士学位论文 前10条
1 王会娜;基于特征提取的肝癌患者乙肝病毒再激活的分类预测[D];齐鲁工业大学;2018年
2 王晓明;基于分类预测技术的软件成本估算方法的研究与应用[D];国防科学技术大学;2010年
3 安俊峰;游戏评价数据的分类预测研究[D];东华大学;2014年
4 张吉宽;蛋白质热稳定性分类预测系统的设计与实现[D];辽宁大学;2016年
5 陶雨雨;决策树及神经网络算法在股票分类预测中的应用[D];杭州电子科技大学;2014年
6 石雪娜;基于压缩感知的蛋白质功能分类预测[D];北京交通大学;2014年
7 杨晓鹏;大数据环境下隐私保护的预测服务机制研究[D];西安电子科技大学;2017年
8 肖芳;工业产品运输需求分类预测理论研究[D];长安大学;2011年
9 于成群;基于集成学习的数据库营销研究[D];重庆大学;2016年
10 何凯;支持向量机方法在智能医疗诊断系统中的应用与研究[D];浙江大学;2007年
本文编号:2832995
本文链接:https://www.wllwen.com/yixuelunwen/zlx/2832995.html