当前位置:主页 > 医学论文 > 预防医学论文 >

基于类不平衡处理的乳腺癌预后预测模型研究

发布时间:2020-06-11 22:27
【摘要】:目的:本文探讨不平衡分类的乳腺癌数据集基于机器学习方法预测预后的生存状态。本研究旨在根据1845名乳腺癌患者的随访数据,建立出稳定、可靠的预测模型,以此为基础选择预测效果相对较好的预后预测模型。对影响乳腺癌预后生存或死亡状态的因素进行探讨,选择解释性不同的模型对影响因素解释。方法:乳腺肿瘤预后的生存状态数据为不平衡数据,本文使用SMOTE、Borderline-SMOTE、AD ASYN、One-sided select处理乳腺肿瘤生存状态的不平衡数据。对预后状态分类选用经典决策树、条件推断树、随机森林和支持向量机。评价指标采用准确率、敏感度、特异性、正例命中率、负例命中率来评价分类器的效果;对收集的乳腺癌数据集进行初步的探索性分析,针对Logistic回归模型,解释回归系数和一元优势比的估计值,给出决策树每个分支所对应的因素及对应结局发生的概率、使用随机森林方法对影响乳腺癌患者预后生存状态的影响因素进行排序。结果:(1)针对乳腺癌患者预后数据集生存状态不平衡这一问题,欠采样方法One-Sided select技术,结合条件决策树预测,在不平衡的乳腺癌数据集中预后预测效果最好,将敏感度由2%提高到58%,提高了56%。(2)使用Cox分析中的逐步向前法后,从因变量中筛选出:T分期、N分期、孕激素、HER2、是否采用内分泌治疗和是否进行化疗。(3)Logistic回归筛选出年龄、N分期、乳腺癌内分泌治疗、化疗手段、多灶性病灶、化疗。通过随机森林的特征变量的重要性来看,年龄、激素受体表达、肿块大小、N分期、临床分期、T分期变量的重要性更靠前。结论:本文所针对类不平衡乳腺癌数据集所使用的数据挖掘方法,同样可以用于其他类不平衡疾病数据集,也可用于疾病的发生、发展、治疗方法的疗效及最终预后的影响因素等更多的医学研究。
【图文】:

技术路线图,全文,挖掘分析,关联规则


9图 1 全文技术路线图Fig. 1 Technology Road Map of Thesis3 研究方法为了对收集到的数据集进行挖掘分析,常使用的方法包括分类、回归、聚类、关联规则分析等。数据挖掘的一个流程图如下:

流程图,数据挖掘,流程图


图 2 数据挖掘流程图Fig. 2 Data mining flow chart一个数据挖掘分析的基本流程,主要有三块:对要分析选择合适的数据挖掘方法及挖掘软件和结合实际分析的目标是根据需求明确要做什么,然后就是根据目标获取的挖掘技术,最后就是对挖掘的结果进行分析,不断的结果,从而获得一个稳定有效、准确而有意义的模型,合实际的解决方案。及预处理机构工作人员收集数据的方式不同,医学数据通常包含衡、缺失和无关变量[17]。此外,医疗数据还存在数据量平衡的[18,19]。以上罗列的原始数据集存在问题会造成后数据挖掘的性能也会被降低。因此,数据预处理应作为,,并且数据预处理在数据挖掘中耗费 70%-80%的时间[20学数据集可以提高临床可解释性[21]、降低计算成本[22]、
【学位授予单位】:新疆医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R737.9;R181.3

【相似文献】

相关期刊论文 前10条

1 陈莉莉;石菊芳;刘玉琴;岳馨培;王乐;马恒敏;黄慧瑶;王仲照;代敏;;基于人群的乳腺癌预后参数研究现状[J];中华乳腺病杂志(电子版);2018年06期

2 公彦栋;黄焰;;乳腺癌预后预测评估模型的研究进展[J];癌症进展;2016年09期

3 魏美琴;;中药在乳腺癌预后复发中的应用进展[J];中国继续医学教育;2016年09期

4 雷蕾;吴斌;何涛;汤艳;;2001至2012年乳腺癌预后因素研究的中文文献计量分析[J];泸州医学院学报;2014年02期

5 郭雅明;吴万敏;李艳杰;;乳腺癌预后的相关因素研究进展[J];内蒙古医学杂志;2008年01期

6 白杰;吴万敏;吕时来;;乳腺癌预后因素研究新进展[J];临床外科杂志;2007年06期

7 胡晓清;陈理达;赵挺;;BMI与乳腺癌预后关系的临床分析[J];临床医学;2006年02期

8 白杰;吴万敏;;乳腺癌预后因素研究新进展[J];内蒙古医学院学报;2006年S1期

9 刘秀芹;122例乳腺癌预后指标的表达情况回顾及总结[J];中原医刊;2004年05期

10 朱涛,郑巧敏,董敏;肿瘤标志物对乳腺癌预后的评估[J];井冈山医专学报;2004年03期

相关会议论文 前10条

1 王新远;;关于年龄与乳腺癌预后因素的分析[A];第四届中国肿瘤学术大会暨第五届海峡两岸肿瘤学术会议论文集[C];2006年

2 关晏星;雷秋模;王莉;张芸;段红华;吴根秀;;泌乳素受体与乳腺癌预后的相关性研究[A];2000全国肿瘤学术大会论文集[C];2000年

3 吕明丽;张小平;蔡海东;;乳腺癌预后相关细胞因子的分析[A];中华医学会第九次全国核医学学术会议论文摘要汇编[C];2011年

4 刘鹏;王颖;宁连胜;孟洁;狄根红;孙慧;战忠利;王庆生;张利华;;PCNA对Ⅰ期乳腺癌预后意义的评估[A];2000全国肿瘤学术大会论文集[C];2000年

5 许丹宁;川允波;;雌激素受体及其在乳腺癌中的作用研究进展[A];中国畜牧兽医学会兽医产科学分会第五届全体会议第十次学术研讨会论文集[C];2009年

6 陈雅青;;DCE-MRI与乳腺癌预后相关性研究[A];中华医学会第16次全国放射学学术大会论文汇编[C];2009年

7 李红霞;范钦和;李吉友;解云涛;;p73 G4C14-to-A4T14(GC/AT)基因多态性与乳腺癌预后的关系[A];中华医学会病理学分会2007年学术年会暨第九届全国病理大会论文汇编[C];2007年

8 袁們;王雯邈;常江;于典科;徐兵河;;乳腺癌差异表达基因3`UTR遗传变异与三阴性乳腺癌预后的关联研究[A];第八届中国肿瘤学术大会暨第十三届海峡两岸肿瘤学术会议论文汇编[C];2014年

9 陈益定;吴金民;郑备义;陈丽荣;邓甬川;王海军;彭佳萍;郑树;;Ki-67核抗原与SPF值的相关性及其与乳腺癌预后的关系[A];2000全国肿瘤学术大会论文集[C];2000年

10 张志刚;黄建;;CXCR4的表达与乳腺癌预后及病理特征的Meta分析[A];国家级“乳腺癌诊治新进展”学习班暨学术年会论文汇编[C];2013年

相关重要报纸文章 前4条

1 记者 张梦然;三种罕见基因突变影响乳腺癌预后[N];科技日报;2018年

2 余志平;甲状腺激素影响乳腺癌预后[N];中国医药报;2005年

3 余科;乳腺癌预后判断[N];医药经济报;2009年

4 记者 冯卫东;乳腺癌预后有了新生物标记[N];科技日报;2014年

相关博士学位论文 前10条

1 李晶;彩色多普勒超声对乳腺癌诊断和灰阶超声对乳腺癌预后的研究[D];中国医科大学;2007年

2 王妍妍;生物标志物与乳腺癌预后关系的相关研究[D];浙江大学;2015年

3 毕晓峰;乳腺癌相关蛋白表达分析及与临床预后关系的研究[D];中国协和医科大学;2008年

4 张灵小;多基因单核苷酸多态与三阴性乳腺癌预后及疗效的关联研究[D];北京协和医学院;2012年

5 杜跃耀;肾上腺素受体表达及相关的基因多态性与乳腺癌预后及易感性的研究[D];复旦大学;2012年

6 谭茹;动态增强磁共振血管成像与乳腺癌预后因素的相关性分析[D];山东大学;2015年

7 孟祥颖;Bcl-2及相关miR-16、miR-15b、miR-195对乳腺癌预后影响的研究[D];中国人民解放军军事医学科学院;2010年

8 周幸春;肿瘤/睾丸抗原在乳腺癌组织中的表达与乳腺癌预后相关性的研究[D];第四军医大学;2012年

9 傅佩芬;胰岛素样生长因子1受体在乳腺癌中的表达及临床意义[D];浙江大学;2013年

10 刘芳芳;肿瘤浸润Treg细胞的化疗敏感性及其与乳腺癌预后关系的研究[D];天津医科大学;2011年

相关硕士学位论文 前10条

1 王哲;基于类不平衡处理的乳腺癌预后预测模型研究[D];新疆医科大学;2019年

2 魏选东;基于芯片分析的乳腺癌预后核心基因筛选及其预测效果分析[D];湖南师范大学;2018年

3 黄鹏;基于基因共表达网络分析的三阴性乳腺癌预后相关基因与铂应答靶点关系的研究[D];中国医科大学;2018年

4 王梦;原发病灶病理缓解状态对ypN0期乳腺癌预后的影响[D];天津医科大学;2018年

5 邸世恺;血清催乳素水平与乳腺癌预后有关临床及病理因素的相关性研究[D];青海大学;2018年

6 赖雨程;雌激素受体β(ERβ)对乳腺癌预后预测的Meta分析和文献综述[D];浙江大学;2017年

7 覃宇周;复发转移相关基因联合表达判断早期乳腺癌预后的研究[D];广西医科大学;2007年

8 王超;基于细胞信号通路互作的乳腺癌预后计算模型研究[D];西南大学;2016年

9 乔向彬;探讨超声弹性成像评估乳腺癌预后的价值[D];遵义医学院;2013年

10 谭浩翔;内皮素-1与乳腺癌预后的关系[D];福建医科大学;2004年



本文编号:2708563

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/2708563.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bbd91***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com