当前位置:主页 > 医学论文 > 肿瘤论文 >

基于特征提取的肝癌患者乙肝病毒再激活的分类预测

发布时间:2020-10-09 00:55
   乙肝病毒(Hepatitis B virus,HBV)再激活是原发性肝癌(Primary Liver Cancer,PLC)患者经精确放疗后常见的并发症。建立对PLC患者精确放疗后HBV再激活的分类预测模型可以提前进行预防治疗,减少发病率。本文提出了基于特征选择的HBV再激活分类预测模型。把山东省肿瘤医院90例原发性肝癌患者精确放疗后的28个临床指标作为研究数据,28个特征中不全是危险因素,存在数据冗余,所以需要从28个特征中选出几个危险因素,建立HBV再激活分类预测模型。本文提出两种分类预测模型,一种是基于顺序选择和主成分分析的HBV再激活分类预测模型,另一种是基于小波和随机森林的HBV再激活分类预测模型。实验结果显示,第一种模型中,当采用顺序前向方法选出:放疗次数、HBV DNA水平、外放边界、甲胎蛋白AFP、分割方式这5个特征为HBV再激活的最佳危险因素组合时,分类精度最高达到84.04%,其中放疗次数、甲胎蛋白AFP、分割方式是新提出的危险因素。采用顺序后向方法选出:HBV DNA水平、KPS评分、外放边界、等效生物计量、TNM肿瘤分期这5个特征子集为HBV再激活的最佳危险因素组合,分类精度最高达到87.31%,其中等效生物计量是本文提出的一个新的危险因素。将上述两种方法选出危险因素的并集用主成分进行特征分析,发现八个危险因素都是影响HBV再激活的危险因素,没有冗余信息。第二种模型中,使用随机森林进行特征提取发现TNM肿瘤分期、外放边界、HBV DNA水平、V10、V20为致使HBV再激活的最佳危险因素组合,使用随机森林和贝叶斯对这组危险因素子集进行分类预测,最高分类精度为84.66%。为消除数据中存在的噪声,实验又采用一位连续小波对原始数据集进行连续小波变换,然后再用随机森林进行特征选取发现:等效生物计量、HBV DNA水平、KPS评分、门脉癌栓有无、GTV体积这5个特征为HBV再激活的最佳危险因素组合,使用随机森林对这组特征子集进行分类预测,预测精度最高达到82.11%。本文提出的HBV再激活的分类预测模型可以很好地用于解决HBV再激活分类预测问题,打破了传统的仅使用医学方法找出危险因素的限制,实现了计算机领域与医学领域的紧密结合。
【学位单位】:齐鲁工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:R735.7;TP181
【部分图文】:

直方图,危险因素


齐鲁工业大学硕士学位论文的危险因素子集,使用支持向量机进行分类预测时,预测精度最高,灵敏性和异性也都高于其他组合。因此我们把两种方法选出的特征子集规模为 5 时的特作为最优的危险因素组合,顺序选择算法找到的危险因素组合有交集但不完全同,为验证交集中的危险因素是否有冗余信息,又用 PCA 对这些危险因素进行析。.4.3 基于主成分分析的特征处理将上面前向选择和后向选择方法选出的危险因素组合求并集,即将“HBVNA 水平、外放边界、AFP、放疗次数、分割方式、KPS 评分、TNM 肿瘤分期和效生物剂量”作为顺序选择算法找到的总的危险因素子集,通过主成分分析法证 8 个特征中是否有冗余信息。根据实验将这 8 个特征的贡献率绘制成直方图。

重要性,原始特征,数值,冗余信息


图 4.3 原始特征集中每个特征的重要性从上图可以看出 28 个特征的重要性数值相差悬殊,重要性值有正有负,没有律,因此并非所有特征都是有用的。一般认为特征重要性值为正代表有用信息,为负的,代表冗余信息,我们认为是噪声。为便于分析,将重要性值大于 0.1 的征统计进行排序,然后整理成表格 4.9。表 4.9 重要性大于 0.1 的特征特征编号 对应的特征 重要度7 Child-Pugh 0.1223 V30 0.1316 PTV 体积 0.1422 V25 0.1525 V40 0.1726 V45 0.18

波形图,小波变换,层数,图形


图 4.4 不同层数下的小波变换图形从图 4.4 小波变换后的波形图中可以看出,原始特征集小波变换图的奇异点不突出,第三层小波波形图中奇异点的变化相对较明显。对比表 4.8 中的分类结果可以得出:对原始数据进行小波变化后,当选取小波变换后的第 3 层数据作为处理后的数据,然后通过随机森林选出 5 个关键特征建立的随机森林分类模型是最佳的分类预测模型。将小波层次固定为 3,对经小波处理后的数据和未经小波处理的数据进行随机森林分类,分类结果如表 4.11 所示。表 4.11 小波处理后的分类结果特征集 处理方法 正确率 灵敏性 特异性原始特征集无 77.88% 98.80% 4.7%小波变换 78.88% 98.28% 6.5%等效生物计量、HBV DNA 水平、KPS 评分、无 80.27% 95.14% 30.17%

【相似文献】

相关期刊论文 前10条

1 宋维康;徐冰;;煤与瓦斯突出分类预测方法分析[J];煤;2016年04期

2 李倩倩;姜景;李瑛;刘怡君;;我国政务微博转发规模分类预测[J];情报杂志;2018年01期

3 路小娟;朱正平;;太阳能光伏发电量分类预测研究[J];自动化与仪器仪表;2016年01期

4 陆桂明;张源;周志敏;;基于机器学习的贫困生分类预测研究[J];计算机应用与软件;2019年01期

5 屈玉涛;邓万宇;;基于matlab的svm分类预测实现[J];信息通信;2017年03期

6 王与;刘洋;;分类技术在高校教学管理中的应用[J];滁州学院学报;2011年05期

7 莫世华,俞敏;霍乱发病地区分类预测方法研究[J];浙江预防医学;1999年10期

8 马寅午,周晓阳,尚金成,张勇传,顾宁昌,刘丹雅,谭培伦;防洪系统洪水分类预测优化调度方法[J];水利学报;1997年04期

9 陈晖;胡泽根;李云鹏;葛丽珍;李彦来;;自组织神经网络技术在新油田快速评价中的应用[J];重庆科技学院学报(自然科学版);2017年02期

10 叶奇明;罗飞;刘娟;;基于多目标EDA的特征基因选择[J];计算机应用研究;2009年08期

相关会议论文 前3条

1 沈杰;李卫华;唐峗;;一种基于化合物子结构模式识别的分类预测方法[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

2 孙蕾;罗建书;;基于分类预测的高光谱遥感图像无损压缩[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

3 罗三华;黄建华;邱建丁;;小波支持向量机在蛋白质二级结构分类预测中应用[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

相关博士学位论文 前4条

1 刘惠;蛋白质序列数据的分类预测研究[D];上海交通大学;2007年

2 王立鹏;特征提取及分类算法在膜蛋白分类预测问题中的应用[D];兰州理工大学;2010年

3 廖志芳;大肠早癌辅助诊断数据挖掘方法研究[D];中南大学;2008年

4 王彤;高维生物数据的分类与预测研究[D];上海交通大学;2009年

相关硕士学位论文 前10条

1 王会娜;基于特征提取的肝癌患者乙肝病毒再激活的分类预测[D];齐鲁工业大学;2018年

2 王晓明;基于分类预测技术的软件成本估算方法的研究与应用[D];国防科学技术大学;2010年

3 安俊峰;游戏评价数据的分类预测研究[D];东华大学;2014年

4 张吉宽;蛋白质热稳定性分类预测系统的设计与实现[D];辽宁大学;2016年

5 陶雨雨;决策树及神经网络算法在股票分类预测中的应用[D];杭州电子科技大学;2014年

6 石雪娜;基于压缩感知的蛋白质功能分类预测[D];北京交通大学;2014年

7 杨晓鹏;大数据环境下隐私保护的预测服务机制研究[D];西安电子科技大学;2017年

8 肖芳;工业产品运输需求分类预测理论研究[D];长安大学;2011年

9 于成群;基于集成学习的数据库营销研究[D];重庆大学;2016年

10 何凯;支持向量机方法在智能医疗诊断系统中的应用与研究[D];浙江大学;2007年



本文编号:2832995

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/2832995.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1ab13***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com