当前位置:主页 > 科技论文 > 软件论文 >

数据挖掘决策树在结直肠癌预后预测中的研究与应用

发布时间:2018-03-03 18:47

  本文选题:结直肠癌 切入点:决策树模型 出处:《福建医科大学》2016年硕士论文 论文类型:学位论文


【摘要】:目的1.探讨数据挖掘决策树在结直肠癌数据分析中的应用。2.应用决策树模型预测结直肠癌患者术后生存时间。方法1.收集2010年1月—2011年12月期间,于福建医科大学附属第一医院胃肠外科二区的结直肠癌患者的临床数据资料,所有病人均经影像学及术后病理确诊,并以此建立数据库软件平台。2.筛选出具有完整资料的病例,以性别、年龄、CEA、围手术期输悬浮红细胞量、手术方式、手术时间、术中出血量、肿瘤生长部位、肿瘤分化程度、原发肿瘤(T)、区域淋巴结(N)、远处转移(M)、远处转移时间、术后化疗、其他治疗等15项与患者预后相关的因素建立excel表格;对excel表格中各变量予以数值标注,计算出各变量对于数据样本的信息增益值,并筛选出与患者术后生存时间相关性较密切的预测变量;3.建立模型数据流,并根据信息增益值以C5.0算法建立决策树模型,选择分类算法,采用分割样本验证法,使用随机分配,训练样本量为90%,验证样本量为10%,共进行10次训练、验证。4.输出预测结果,并由散点图对患者术后预测生存时间与实际生存时间进行比较与验证;结果1.建立了福建医科大学附属第一医院胃肠外科二区2010年1月至2011年12月期间结直肠癌数据库软件平台;2.建立结直肠癌患者术后生存时间决策树预测模型,输出结果显示:训练样本的准确率为69.8%,验证样本的准确率为75.8%。3.通过预测生存时间与实际生存时间散点图比较对结果进行验证,验证结果显示:预测生存时间与实际生存时间具有较高符合度。结论1.决策树模型可以用于结直肠癌患者术后生存分析。2.决策树模型可以对结直肠癌患者术后生存时间进行个体化预测。
[Abstract]:Objective 1. To explore the application of data mining decision tree in data analysis of colorectal cancer. 2. To predict postoperative survival time of colorectal cancer patients by using decision tree model. The clinical data of patients with colorectal cancer in the second area of gastrointestinal surgery of the first affiliated Hospital of Fujian Medical University were confirmed by imaging and postoperative pathology, and the database software platform .2. was established to screen the patients with complete data. According to sex, age, quantity of suspended red blood cell transfusion, operative mode, operative time, intraoperative bleeding, tumor growth site, tumor differentiation, primary tumor, regional lymph node, distant metastasis, distant metastasis time, postoperative chemotherapy. Fifteen factors related to patients' prognosis, such as other treatments, were used to establish excel tables, and the variables in the excel table were numerically annotated to calculate the information gain value of each variable for the data sample. The model data flow was established, and the decision tree model was established by C5.0 algorithm according to the value of information gain, the classification algorithm was selected, the method of partition sample verification was used, and the random distribution was used. The training sample size was 90 and the verification sample size was 10. Ten times of training were carried out, and the predicted results were outputted, and the survival time predicted after operation was compared with the actual survival time by scatter plot. Results 1. From January 2010 to December 2011, a database software platform for colorectal cancer was established in the second area of gastrointestinal surgery, the first affiliated Hospital of Fujian Medical University. 2. The prediction model of survival time decision tree for patients with colorectal cancer was established. The output results show that the accuracy of the training sample is 69.8, and the accuracy of the verification sample is 75.8.3.The results are verified by comparing the predicted survival time with the actual survival time scatter plot. The results show that the predicted survival time has a high coincidence with the actual survival time. Conclusion 1. The decision tree model can be used for postoperative survival analysis of colorectal cancer patients. 2. Decision tree model can be used for postoperative colorectal cancer patients after birth. 2. Individual prediction of storage time.
【学位授予单位】:福建医科大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R735.3;TP311.13

【相似文献】

相关期刊论文 前10条

1 王汉涛 ,Kraemer M.;随访危险因素分析:复发和非复发结直肠癌的比较[J];中国实用外科杂志;2001年12期

2 苏森;患结直肠癌妇女后代癌症的危险性增加[J];中国肿瘤;2001年06期

3 汪一虹;在确定的法国人群中年龄<45岁结直肠癌病人与≥45岁结直肠癌病人的比较[J];国外医学(消化系疾病分册);2002年01期

4 李会晨;结直肠癌解剖位置的连续性右向迁移[J];国外医学.外科学分册;2003年03期

5 李志霞;结直肠癌复发及转移的综合治疗[J];中华胃肠外科杂志;2003年06期

6 何建苗,蒲永东,曹志宇,刘卫平;老年人结直肠癌186例的外科治疗[J];中华胃肠外科杂志;2003年05期

7 保红平,方登华,高瑞岗,李奎,张雪松,刘天锡;青年人结直肠癌临床病理分析[J];中国普外基础与临床杂志;2004年01期

8 章江;;监测结直肠癌非常必要[J];国外医学情报;2004年04期

9 郜文秀,杨艳芳,梁小波,李耀平,李佩珍;细胞粘附分子变异体在结直肠癌中的表达及预后[J];中国公共卫生;2005年07期

10 Nozawa T. ,Enomoto T. ,Koshida Y. ,M. Kuranami,王志宇;人结直肠癌黏膜下血小板源性内皮细胞生长因子特异性增强表达[J];世界核心医学期刊文摘(胃肠病学分册);2005年06期

相关会议论文 前10条

1 郑树;;结直肠癌预后与转移相关因素分析[A];2005年浙江省肿瘤学术会议全国大肠癌转移与复发的诊治研讨会学术论文集[C];2005年

2 邹一峰;吴小剑;兰平;;结直肠癌免疫治疗新进展[A];第十一次全国中西医结合大肠肛门病学术会议论文汇编[C];2006年

3 郁宝铭;;结直肠癌治疗的进展及其新理念[A];2006年浙江省肛肠外科学术年会论文汇编[C];2006年

4 王锡山;;结直肠癌治疗的困惑之我见[A];第九届全国肿瘤转移学术大会暨2011年黑龙江省医学会肿瘤学年会报告集[C];2011年

5 秦建平;;未病思想中的结直肠癌预防[A];贵州省中西医结合学会肛肠学会第五届学术交流会暨新技术新进展学习班论文汇编[C];2012年

6 高文庆;陈会林;童蕾;陆松春;;老年梗阻性结直肠癌诊疗体会(附42例报告)[A];首届“之江中医药论坛”暨浙江省中医药学会2011年学术年会论文集[C];2011年

7 王启远;周长江;高云飞;徐岩;李坤;;血管内皮生长因子与结直肠癌[A];《中华急诊医学杂志》第八届组稿会暨急诊医学首届青年论坛论文汇编[C];2009年

8 巴一;;结直肠癌靶向治疗进展[A];第三届中国肿瘤内科大会教育集暨论文集[C];2009年

9 何超;朱洪波;;结直肠癌的生物治疗[A];2009年浙江省肿瘤外科学术年会暨肿瘤外科规范化诊治学习班论文汇编[C];2009年

10 万德森;;进一步提高结直肠癌疗效的思考[A];2009年浙江省肿瘤学术年会暨肿瘤诊治新进展学习班论文汇编[C];2009年

相关重要报纸文章 前10条

1 中华医学会肿瘤学分会主任委员 顾晋;分期不精确 致结直肠癌过度治疗[N];健康报;2012年

2 本报记者 贾岩;跨线治疗成结直肠癌最后防线[N];医药经济报;2012年

3 本报记者 贾岩;跨线治疗构筑结直肠癌最后防线[N];医药经济报;2012年

4 本报记者 林琳;结直肠癌:可以治愈的癌症[N];医药经济报;2013年

5 记者 张妍 通讯员 熊静帆 朱品磊;深圳结直肠癌发病高于全国[N];深圳商报;2013年

6 本报记者 孙刚;预防结直肠癌:请管住嘴[N];解放日报;2013年

7 上海市中医医院肿瘤科 侯凤刚 副主任医师;中医药在结直肠癌治疗中的作用和特色[N];上海中医药报;2014年

8 李华虹 孙瑜淼 记者 李丽云 实习生 阴浩;专家呼吁:结直肠癌应多学科规范化诊疗[N];科技日报;2014年

9 ;降低结直肠癌复发有新疗法[N];人民日报;2003年

10 韩自力;新化疗方案可高效治疗结直肠癌[N];健康报;2007年

相关博士学位论文 前10条

1 陈涛;MicroRNA-31/FIH-1调控关系在结直肠癌发生发展中的作用及其机制研究[D];复旦大学;2014年

2 任翡;MYBL2基因在结直肠癌的表达及机制的初步探讨[D];复旦大学;2014年

3 吴朋;结直肠癌中microRNA-615基因甲基化及其生物学特性探究[D];复旦大学;2014年

4 李泽武;MicroRNA-203靶向ZNF217基因调控结直肠癌生物学行为的研究[D];山东大学;2015年

5 徐兴远;低分子肝素对结直肠癌患者预后的影响及相关机制的研究[D];复旦大学;2014年

6 梁洪亮;miR-454在结直肠癌中的功能及其作用机制[D];山东大学;2015年

7 金鹏;MMR蛋白在雌激素致结肠癌细胞凋亡中的作用及SEPT9检测结直肠癌的研究[D];第三军医大学;2015年

8 珠珠;云南省Lynch综合征候选基因标志物研究[D];昆明医科大学;2014年

9 周智航;SEMA3F通过下调ASCL2-CXCR4轴而抑制结直肠癌转移的分子机制[D];第三军医大学;2015年

10 王林;MiRNA-300对结直肠癌肿瘤侵袭和增殖的影响及其调控机制的初步研究[D];第三军医大学;2015年

相关硕士学位论文 前10条

1 颜斐斐;术后结直肠癌患者癌因性疲乏与影响因素的研究[D];南方医科大学;2009年

2 李斌;结直肠癌患者就诊延迟分析[D];中南大学;2009年

3 叶建杰;慈溪市结直肠癌危险因素病例对照研究[D];浙江大学;2008年

4 赵波;结直肠癌危险因素及临床流行病学特征的调查与分析[D];广西医科大学;2013年

5 宋艳敏;PAQR3基因甲基化水平与结直肠癌关系的研究[D];河北大学;2015年

6 黎江;Oct4B1在结直肠癌干细胞中的表达及其与Twist的相关性研究[D];遵义医学院;2015年

7 杨文婷;PD-L1、SIRT1在结直肠癌组织中的表达及意义[D];福建医科大学;2015年

8 罗佳;二代测序分析散发性结直肠癌和息肉的基因突变[D];福建医科大学;2015年

9 崔慧鹏;精氨酸琥珀酸合成酶(ASS1)高表达与结直肠癌恶性进展的相关性研究[D];中国人民解放军医学院;2015年

10 崔娟娟;p53和nm23在结直肠癌中的表达及其临床意义[D];河北联合大学;2014年



本文编号:1562248

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1562248.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c4c1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com