基于人血浆microRNAs的数据挖掘技术构建肺癌预测系统
本文关键词: 血浆microRNAs 数据挖掘 肺癌 预测 出处:《郑州大学》2017年硕士论文 论文类型:学位论文
【摘要】:肺癌位居中国恶性肿瘤发病率和死亡率首位,肺癌预防的重要手段是开展早期发现、早期诊断和早期治疗,有必要研究高敏感性和特异性的肿瘤生物标志物。microRNAs(mi RNAs)可调控基因参与细胞的生长、增殖、分化和凋亡等过程,大量的研究表明循环miRNAs和多种肿瘤的发生和发展有关,具有作为包括肺癌在内的疾病诊断生物标志物的潜力。目的该研究应用决策树(Decision Tree,DT)、人工神经网络(Artificial Neual Networks,ANN)和支持向量机(Support Vector Machines,SVM)等数据挖掘方法联合血浆miRNA生物标志、流行病学参数和临床症状资料建立肺癌预测模型。对象和方法1.研究对象:肺癌组为2016年6月至2017年2月取自郑州大学第一附属医院呼吸内科、河南省肿瘤医院胸外科、河南省胸科医院呼吸内科和胸外科的148例初诊的原发性肺癌患者;对照组为2016年7月取自淇县疾病预防控制中心体检的148例健康人群。经知情同意后收集研究对象的信息和血液标本。2.实验方法:血浆miRNAs(mi R-16、miR-21、miR-20a、mi R-210、miR-145、miR-126、miR-223、mi R-197、miR-30a、mi R-30d、miR-25)表达水平的检测采用实时荧光定量PCR法。3.数据挖掘:采用SPSS Clementine 21.0软件。基于单因素分析结果和Logistic回归分析优化结果,先将数据预处理,按3:1的比例将所有样本随机分成训练集和预测集,用训练好的模型对预测集进行预测,应用Fisher判别分析、DT C5.0、ANN和SVM算法分别建立模型,并采用诊断试验评价指标比较模型的预测结果。4.统计学分析:Excel 2010建立数据库,采用SPSS 21.0软件进行统计分析。定量资料分析符合正态分布时采用两独立样本t检验,不符合正态分布时采用Mann-Whitney U检验;定性资料间的比较采用χ2检验;肺癌的影响因素采用二分类Logistic回归分析。检验水准为α=0.05。结果1.血浆miRNAs表达水平检测结果:肺癌组的10种血浆miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表达水平高于对照组,差异有统计学意义(P0.05)。11种血浆miRNAs(miR-16、miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、mi R-197、miR-30a、mi R-30d、miR-25)的表达水平与年龄、肺癌的组织学类型无关(P0.05);血浆中miR-30a和miR-21表达水平与性别有关(P0.05);血浆中mi R-21和miR-25表达水平与吸烟程度、饮酒有关(P0.05)。血浆中miR-210的表达水平和肺癌的分期有关(P0.05);血浆中miR-126的表达水平和肺癌淋巴结转移有关(P0.05)。2.肺癌影响因素分析结果:单因素分析结果显示肺癌组和对照组间的流行病学参数和临床症状(吸烟程度、发热、胸闷胸痛、咳嗽、痰中带血、咯血)的分布的差异和10种血浆miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、mi R-197、miR-30a、mi R-30d、miR-25)的表达水平的差异有统计学意义(P0.05);多因素Logistic回归分析结果显示,发热、胸闷胸痛、咳嗽、血浆中miR-20a(P=0.016)和miR-223(P=0.001)相对表达量升高可能是肺癌的危险因素。3.数据挖掘模型的评价结果:由吸烟程度、发热、胸闷胸痛、咳嗽、痰中带血、咯血、10种血浆mi RNAs(miR-21、miR-20a、miR-210、mi R-145、miR-126、miR-223、mi R-197、miR-30a、miR-30d、mi R-25)的表达水平这16个变量建立的16项DT C5.0模型和由发热、胸闷胸痛、咳嗽、痰中带血、咯血、血浆中miR-20a和miR-223表达水平建立的优化DT C5.0模型的准确度分别为98.78%和87.80%,AUC分别为0.985和0.883;16项SVM模型和优化SVM模型的准确度分别为98.78%和89.02%,AUC分别为0.985和0.893;16项ANN模型和优化ANN模型的准确度分别为87.80%和84.15%,AUC分别为0.879和0.835;16项Fisher判别分析模型和优化Fisher判别分析模型的准确度分别为82.93%和82.93%,AUC分别为0.828和0.824。16项DT C5.0模型和16项SVM模型的AUC均优于其他6种模型(P0.05);其他6种模型的AUC之间的差异没有统计学意义(P0.05)。结论1.人血浆中10种miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、mi R-197、miR-30a、mi R-30d、miR-25)的表达水平与肺癌相关。血浆中miR-20a、mi R-223相对表达量可作为肺癌预测的重要指标。2.本研究建立了基于人血浆中的microRNAs的Fisher判别分析、决策树、神经网络和支持向量机肺癌预测模型;决策树模型和支持向量机模型对肺癌的预测效果最好。
[Abstract]:Lung cancer is the first in Chinese malignant tumor incidence and mortality . The important means of prevention of lung cancer is to carry out early detection , early diagnosis and early treatment , and it is necessary to study the biological markers of lung cancer with high sensitivity and specificity . The expression level of miR - 21 and miR - 21 in plasma was significantly higher than that of control group ( P0.05 ) . The expression level of miR - 21 and miR - 21 in plasma was significantly higher than that of control group ( P0.05 ) . There was significant difference in the expression level of miR - 21 , miR - 20a , miR - 210 , miR - 145 , miR - 126 , miR - 223 , mi R - 197 , miR - 30a , mi R - 30d , and miR - 25 in 10 plasma microRNAs ( miR - 21 , miR - 22 , miR - 210 , mi R - 197 , miR - 30a , and mi R - 25 ) . The accuracy of the 16 SVM models and the optimized ANN models were 98.78 % and 89.02 % , the AUC were 0.985 and 0.893 , respectively . The accuracy of the 16 model of ANN and the optimized ANN model was 82.93 % and 84.15 % , AUC 0 . 828 and 0 . 824.16 . The Fisher discriminant analysis , decision tree , neural network and support vector machine lung cancer prediction model were established .
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13;R734.2
【相似文献】
相关期刊论文 前10条
1 胡婷婷;董玲;张丹瑛;;microRNAs与原发性肝细胞肝癌相关性的研究进展[J];中国临床医学;2013年04期
2 张昌明;张婉芬;刘春蓓;曾科;刘志红;;循环microRNAs与局灶节段性肾小球硬化患者疾病活动的关系[J];肾脏病与透析肾移植杂志;2013年04期
3 魏丽萍;许振坤;姚朱华;;MicroRNAs在冠状动脉粥样硬化性心脏病中的作用及研究进展[J];医学综述;2011年16期
4 任景怡;许宁;韩冠平;陈红;;microRNAs参与动脉粥样硬化疾病的发生[J];中国生物化学与分子生物学报;2011年06期
5 丁婧;孟雁;;microRNAs与糖尿病[J];中国糖尿病杂志;2010年07期
6 徐莎;刘厚奇;;MicroRNAs与信号转导及转录激活因子[J];第二军医大学学报;2013年04期
7 张婉芬;张昌明;刘春蓓;秦卫松;郑春霞;曾科;刘志红;;尿液microRNAs作为局灶节段性肾小球硬化疾病活动生物标志物的研究[J];肾脏病与透析肾移植杂志;2013年04期
8 谭胜;朱涛;;MicroRNAs在消化系相关肿瘤中的研究[J];胃肠病学和肝病学杂志;2009年03期
9 何相宜;袁耀宗;;胰腺癌与糖尿病、胃肠道微生态和microRNAs关系的研究现状[J];胃肠病学;2014年04期
10 曹美群;陈德珩;张春虎;吴正治;;抑郁模型大鼠海马内特异性microRNAs的筛选以及柴胡疏肝散的干预作用[J];中国中药杂志;2013年10期
相关会议论文 前10条
1 王芸;陶筱川;吕应堂;;水稻MicroRNAs在水稻发育过程中的功能研究[A];湖北省植物生理学会第十五次学术研讨会论文集[C];2007年
2 周宁;陈宝元;曹洁;汤华;刘民;邓园;王彦;;microRNAs在阻塞性睡眠呼吸暂停低通气综合征患者血清中的表达及意义[A];中华医学会呼吸病学年会——2013第十四次全国呼吸病学学术会议论文汇编[C];2013年
3 韦晖;王成;范钰;许琪;张辰宇;沈岩;;偏执型精神分裂症血浆microRNAs表达谱的筛查[A];第七届全国医学生物化学与分子生物学和第四届全国临床应用生物化学与分子生物学联合学术研讨会暨医学生化分会会员代表大会论文集[C];2011年
4 单志新;余细勇;林秋雄;符永恒;邓春玉;杨敏;林曙光;;microRNAs、炎症因子及其受体基因在自发性高血压大鼠中的表达[A];第九届全国心血管药理学术会议论文集[C];2007年
5 郭士伟;刘蔼民;;小RNA(MicroRNAs)的发现、结构和功能[A];2006年中国植物逆境生理生态与分子生物学学术研讨会论文摘要汇编[C];2006年
6 郑宗基;刘晓萌;张雷;赵倩伟;李晨钟;薛耀明;;β3肾上腺素受体激动剂对C57BL/6J小鼠脂肪组织棕色化相关基因和microRNAs的影响[A];中华医学会第十二次全国内分泌学学术会议论文汇编[C];2013年
7 李海怡;高璐;左洪亮;钟国华;;昆虫microRNAs功能研究进展[A];公共植保与绿色防控[C];2010年
8 刘红;韩璐璐;谢爽;娄莹;蒋娟娟;田蕾;许莉;李一石;;连续口服厄贝沙坦对健康中国志愿者血浆MicroRNAs表达的影响[A];中国心脏大会(CHC)2011暨北京国际心血管病论坛论文集[C];2011年
9 方巧云;杨森;张学军;;MicroRNAs及其在皮肤病上的应用[A];中华医学会第14次全国皮肤性病学术年会论文汇编[C];2008年
10 韩璐璐;刘红;康健;边文彦;庞会敏;李一石;;冻存血浆中MicroRNAs稳定性评价[A];中国心脏大会(CHC)2011暨北京国际心血管病论坛论文集[C];2011年
相关重要报纸文章 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
相关博士学位论文 前10条
1 詹芸;MicroRNAs在乳腺癌侵袭转移过程中的功能与机制研究[D];北京协和医学院;2015年
2 谭明;血小板源外泌小体中microRNAs作为预测动脉粥样硬化血栓形成的机制研究[D];北京协和医学院;2016年
3 戴欣;microRNAs在胰腺癌相关性糖尿病中的表达及相关机制研究[D];上海交通大学;2013年
4 周可树;MicroRNAs在慢性淋巴增殖性疾病中的表达及其在慢性淋巴细胞白血病预后中的意义研究[D];中国协和医科大学;2010年
5 刘雯静;胰腺癌特异性microRNAs的筛选及机制研究[D];北京协和医学院;2011年
6 于双妮;胰腺癌差异表达microRNAs的鉴定及功能研究[D];北京协和医学院;2008年
7 熊薇;微泡microRNAs在肝癌诊断及发病机制中的作用研究[D];华中科技大学;2012年
8 陈娜;STAT3介导microRNAs调控的IL-9过表达在慢性淋巴细胞性白血病免疫调节机制中的研究[D];山东大学;2014年
9 高刚;氡致肺癌及肺损伤相关microRNAs的研究[D];中国疾病预防控制中心;2010年
10 张彩彩;硫化氢通过microRNAs调控血管新生的机制研究[D];复旦大学;2011年
相关硕士学位论文 前10条
1 谭志军;microRNAs在人骨髓间充质干细胞向汗腺样细胞分化中的作用研究[D];天津医科大学;2015年
2 王倩;基于双链特异性核酸酶介导的MicroRNAs检测新方法的研究[D];华东理工大学;2016年
3 唐千捷;血浆microRNAs预测氯吡格雷抗血小板疗效及心血管不良事件的研究[D];广东药科大学;2016年
4 杨翠云;基于信号放大的高灵敏腺苷与MicroRNAs电化学生物传感器的制备及研究[D];西南大学;2016年
5 杜彦丽;microRNAs对黄牛和水牛朊病毒基因转录后调控研究[D];云南大学;2016年
6 杨丹凤;以microRNAs为靶标结核病新型检测方法的建立[D];吉林农业大学;2016年
7 王晓钰;基于microRNAs对上皮连接蛋白的调控探讨升麻素抗过敏性炎症复发的机制[D];南京中医药大学;2016年
8 刘潇;慢性阻塞性肺疾病差异表达microRNAs及其临床意义[D];山东大学;2017年
9 黄丽敏;MicroRNAs在动脉粥样硬化血管中的异常表达[D];宁夏医科大学;2013年
10 梅丽丽;食管鳞癌中差异表达microRNAs的致癌机制研究[D];昆明理工大学;2017年
,本文编号:1476867
本文链接:https://www.wllwen.com/yixuelunwen/zlx/1476867.html