基于多组学数据的癌症患者生存期预测研究

发布时间:2018-01-29 14:31

  本文关键词: 预后预测 GBM 逻辑回归 支持向量机 出处:《大连海事大学》2017年硕士论文 论文类型:学位论文


【摘要】:目前癌症发病率越来越高,精准的预后预测不仅可以帮助患者了解他们的生存期望,而且还可以帮助研究者了解疾病的发展规律、指导临床治疗。本文提出了一种预测癌症患者生存期的方法,该方法利用数据挖掘技术,研究来自TCGA(The Cancer Genome Atlas)项目的多形性胶质母细胞瘤(GBM,Glioblastoma Multiforme)患者的分子数据和临床数据,得到了一个由特征选择算法和分类算法构成的联合预测模型。与已有研究成果相比,该模型能够以较高的精度预测GBM患者的生存期,判断其生存期是否超过12个月,以便医疗人员能够将患者分到不同的危险组别中,进行更为精准的治疗。本文的主要工作如下:(1)数据的收集和预处理。本文研究的癌症为GBM,所用的分子数据和临床数据均来源于TCGA数据库。并且对下载下来的数据进行了一定的预处理,过程包括:缺失值的定义和填补,去除缺失值过多的特征、样本,标准化处理。(2)针对GBM患者的分子数据和临床数据,利用基于L1正则化的逻辑回归算法进行特征选择。通过理论分析并且与其他三种常用的特征选择算法(基于树模型的特征选择算法,方差选择法,基于逻辑回归的递归特征消除法)相比较,建模对GBM患者生存期预测得到的AUC分数较高,程序运行时间较短。(3)针对GBM患者的分子数据和临床数据,利用支持向量机算法进行分类。通过理论分析并且与其他九种常用的机器学习分类算法相比较,建模对GBM患者生存期预测得到的AUC分数较高,程序运行时间较短。(4)将上述特征选择算法和分类算法相结合得到了一个联合预测模型。利用该模型对GBM患者的生存期进行预测,预测精度与使用类似数据结构的已有研究成果相比有所提高。
[Abstract]:This paper presents a method for predicting the survival time of patients by using data mining . The method uses the data mining technology to study the molecular data and clinical data of patients with the cancer . The method uses the data mining technology to study the molecular data and clinical data from TCGA ( The Cancer Genome Atlas ) .

【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R73-3;TP274;TP181

【参考文献】

相关期刊论文 前2条

1 王冬;Frank B.Hu;;从精准医学到精准公共卫生[J];中华内分泌代谢杂志;2016年09期

2 Stupp R.;Mason W.P.;Van Den Bent M.J.;黄卫东;;放疗与替莫唑胺联合治疗胶质母细胞瘤[J];世界核心医学期刊文摘(神经病学分册);2005年09期



本文编号:1473635

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1473635.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户00da1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com