当前位置:主页 > 医学论文 > 肿瘤论文 >

乳癌病人临床数据的降维处理及生存预测分析

发布时间:2018-09-05 15:16
【摘要】:随着基因技术的发展,可以容易地获取到癌症病人的mi RNA表达水平。近些年的研究发现,mi RNA在癌症转移的过程中扮演着重要角色。从病人的mi RNA表达水平分析病人的病情开始受到大家的关注。本文主要研究高维mi RNA表达水平数据的降维处理和结合临床数据的生存预测分析。病人的临床数据中含有大量的删失数据,进行生存分布函数求解的时候就不能忽视删失数据。本文对于删失数据的处理分别采用乘积限估计法和极大似然估计法得到乳癌病人的生存分布函数,对极大似然估计法解的存在性条件给出了证明。提出同分布插值方法对删失数据进行插值,并对同分布插值方法的误差进行分析。病人临床数据的另一大特点是高维。高维数据的处理方法可以归纳为两类:特征选取和特征抽取。本文对比了最小网格聚类、主成分分析、Isomap三种降维方法。发现Isomap方法中的最短路径预示着癌症的病情发展路径。并对最小网格聚类方法提出了去中心化的修改。最后,在降维数据的基础上,结合临床数据中的癌症不同阶段的分期数据,对比支持向量积方法和决策树方法得到的乳癌分期分类结果。通过对mi RNA表达水平数据和临床数据进行Kruskal-Wallis检验,找出与癌症分期具有相关性的miRNA。通过逐步多元回归方法建立mi RNA表达水平与病人生存期的回归关系,发现逐步回归模型选取的部分mi RNA已经被证明与癌症具有相关性。例如:hsa-mir-548t,hsa-mir-190,hsa-mir-200b等。
[Abstract]:With the development of gene technology, the expression level of mi RNA in cancer patients can be easily obtained. Recent studies have found that RNA plays an important role in cancer metastasis. From the patient's mi RNA expression level analysis of the patient's condition began to attract attention. This paper focuses on dimensionality reduction of high dimensional mi RNA expression level data and survival prediction analysis combined with clinical data. There are a lot of censored data in the patient's clinical data, so we can not ignore the censored data when solving the survival distribution function. In this paper, we obtain the survival distribution function of breast cancer patients by product limit estimation and maximum likelihood estimation, respectively, and prove the existence condition of the solution of the maximum likelihood estimation method. The same distribution interpolation method is proposed to interpolate censored data and the error of the same distribution interpolation method is analyzed. Another characteristic of patient clinical data is high dimension. The processing methods of high-dimensional data can be divided into two categories: feature selection and feature extraction. In this paper, three dimensionality reduction methods, minimum grid clustering and principal component analysis (PCA), are compared. The shortest path in Isomap method is found to predict the progression of cancer. A decentralization modification is proposed for the minimum mesh clustering method. Finally, based on the dimensionality reduction data and the staging data of different stages of cancer in clinical data, the classification results of breast cancer stages obtained by support vector product method and decision tree method are compared. Through the Kruskal-Wallis test of mi RNA expression level data and clinical data, we find out the miRNA. which has correlation with cancer stage. The regression relationship between mi RNA expression level and patient survival was established by stepwise multivariate regression method. It was found that part of mi RNA selected by stepwise regression model had been proved to be correlated with cancer. For example: hsa-mir-548t, hsa-mir-190, hsa-mir-200b, etc.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R737.9

【相似文献】

相关期刊论文 前10条

1 周雪忠;刘保延;姚乃礼;李平;王映辉;王春山;于彤;穆钊;徐兴良;;中医临床数据仓库的研究及构建[J];国际中医中药杂志;2006年06期

2 刘闽碧;;以时间为导向的临床数据管理[J];华北煤炭医学院学报;2007年01期

3 赵丽娜;周吉顺;;中医临床数据信息化过程中的标准化问题[J];世界科学技术(中医药现代化);2011年04期

4 成福春;尹岭;方肇勤;朱抗美;张平;刘珉;仲毅;;中医临床数据分析模型构建[J];中国中医基础医学杂志;2009年06期

5 孟繁荣;刘永兰;王军成;;医院临床数据中心建设问题分析[J];解放军医药杂志;2012年12期

6 蔡长坤;;采用非实验设计的临床数据求算药动参数[J];江西中医学院学报;1993年03期

7 杨建伟;心血管病临床数据计算机检索系统的设计[J];医学信息;1998年10期

8 吴美京;吴骋;王睿;贺佳;;临床试验数据管理培训——现状、经验与展望[J];西北医学教育;2009年05期

9 邓亚中;于嘉;刘川;刘宗范;;电子化时代临床数据管理现状和未来趋势[J];中国新药杂志;2014年08期

10 过骏愈;杨岱冰;;临床数据中心的应用[J];中国医疗设备;2014年06期

相关会议论文 前8条

1 王禹毅;韩梅;陈妮妮;李青;刘建平;;从如何获得高质量临床数据探讨临床试验的数据管理[A];第七届中医/中西医结合循证医学方法研讨会会议材料[C];2013年

2 张华;张笑波;赵宏杰;林宇春;;证的量化与临床数据的定性的方法学理论基础[A];中国中西医结合学会诊断专业委员会2009’年会论文集[C];2009年

3 张华;张笑波;赵宏杰;林宇春;;证的量化与临床数据的定性的方法学理论基础[A];2009全国时间生物医学学术会议论文集[C];2009年

4 张华;张笑波;赵宏杰;;证的量化与临床数据的定性的方法学理论基础[A];中华中医药学会第二届中医方证基础研究与临床应用学术研讨会论文集[C];2008年

5 潘宏铭;;从临床试验到临床实践—埃克替尼Ⅳ期临床数据分析[A];2013年第六届国家级分子靶点药物治疗新进展学习班暨浙江省肿瘤化疗学术年会论文集[C];2013年

6 李岭;季星来;李妍;李春义;;生物信息学研究中临床数据解读方面可能存在的若干问题的探讨[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年

7 韩钊;臧秋玲;叶祖森;王苹莉;樊恺;曹云刚;耿媛媛;张征;;卒中临床数据登记系统的研究开发[A];医学科研管理前沿与实务研讨班论文集[C];2009年

8 韩钊;臧秋玲;叶祖森;项崇雷;陈小丽;邵蓓;郑荣远;;《卒中临床数据登记系统V1.0》软件的开发与使用[A];2008年浙江省神经病学学术年会论文汇编[C];2008年

相关重要报纸文章 前7条

1 本报记者 贾岩;谢燕彬:临床数据管理亟待加强[N];医药经济报;2014年

2 孙亚林 贺佳 曹阳;临床数据管理期待实现电子化[N];中国医药报;2005年

3 记者 邢宇皓;全球最大重疾数据样本资源库开建[N];光明日报;2010年

4 王兰;FDA要求罗氏Actemra更多非临床数据[N];中国医药报;2008年

5 实习记者  陈蕾 驻沪记者 张莉;中医的数字化方向[N];医药经济报;2006年

6 汪少颖;专家建议加强中成药临床数据整理研究[N];中国中医药报;2003年

7 邵建国;他司鲁肽因临床数据不佳失宠[N];医药经济报;2010年

相关博士学位论文 前1条

1 周天舒;国际临床数据交换关键技术研究及系统实现[D];浙江大学;2013年

相关硕士学位论文 前9条

1 赵寒;面向临床医学数据的潜变量建模关键问题与技术研究[D];北京工业大学;2015年

2 刘骏健;基于openEHR的临床数据中心设计与实现[D];浙江大学;2016年

3 陈景安;乳癌病人临床数据的降维处理及生存预测分析[D];哈尔滨工业大学;2016年

4 孙亚林;临床数据管理系统研究及其在数据规范化管理中的应用[D];第二军医大学;2005年

5 周敏;中医临床数据汇交及技术平台构建方案研究[D];湖北中医药大学;2014年

6 刘一帆;基于电子病历的科室临床数据中心的实现[D];中山大学;2014年

7 张瑶;影响临床数据质量的因素及数据采集方法的选择[D];复旦大学;2012年

8 程雯丽;判别和聚类方法在针灸临床数据分析中的应用研究[D];东华大学;2013年

9 黄宗浩;临床数据统计分析在UIS系统中的设计与实现[D];华东理工大学;2013年



本文编号:2224662

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/2224662.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b1eaa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com