当前位置:主页 > 管理论文 > 领导决策论文 >

决策树模型在预测乳腺癌5年生存状况研究中的应用

发布时间:2022-01-27 09:47
  目的:通过构建决策树(Decision Tree,DT)模型对女性乳腺癌5年内生存状况进行预测,为临床医生预测乳腺癌患者的预后和调整个体化的随访策略提供参考。方法:本研究对2010年1月至2014年10月确诊的405例乳腺癌患者的生存状况进行了随访,确定了患者自确诊乳腺癌后5年内的生存状况(生存或死亡),并记录了与乳腺癌预后可能相关的17种因素。通过多种模型筛选,最后选择DT的回归树算法(Classification and Regression Tree,CART)构建了预测模型,在参数调整后,对这405例患者进行了10折交叉验证(cross validation,CV)的训练及测试。最后通过受试者特征(Receiver Operating Characteristic Curve,ROC)曲线、Precision–Recall(PR)曲线、学习曲线、校正曲线对模型性能进行了评估。结果:经过计算,决策树模型在十倍交叉验证中获得了理想的结果:平均召回率=0.91,标准差=0.05。而预测结果验证了结果和模型的稳定性:召回率=0.88,准确率=0.92,F1值=0.86,真阳性率(Tru... 

【文章来源】:吉林大学吉林省211工程院校985工程院校教育部直属院校

【文章页数】:60 页

【学位级别】:硕士

【部分图文】:

决策树模型在预测乳腺癌5年生存状况研究中的应用


混淆矩阵构成

过程图,机器学习,过程,变量


第4章过程与结果18第4章过程与结果机器学习针对不同的数据和要求有着不同的方法,但对于具有明显分类属性的乳腺癌数据,整体过程基本相同,主要步骤如图2。图4.1机器学习基本过程4.1数据分析(1)数据预处理:收集到的数据包含多个特征,且各种变量的原始描述方式包含连续型变量、离散型变量和非数值变量等,因此在进行计算之前,首先对所有特征进行预处理,将特征描述数值化和归一化。同时需要对数据进行分析,检测缺失值及异常值,并筛除不必要的特征。(见表4.1)

分布图,数据,重要性,权重


第4章过程与结果26图4.9部分预测数据及结果4.3.2特征与原理模型预测纳入了17项特征,为了明确17项特征对本模型的影响程度,我们得到了特征重要性的分布图。图中所示,特征权重最大的是病理分期,且权重占比约0.30,是第2位特征(分子分型)的近3倍,其次是HER2表达状态、肿瘤大小和月经状态。而年龄、内分泌治疗和有无周边组织浸润等特征在本模型预测过程中所表现出的重要性近占比0.03左右。由参数max_features=14可知,ER表达、放射治疗和化学治疗三项特征未参与模型的预测。(见图4.10)。图4.10特征重要性

【参考文献】:
期刊论文
[1]C4.5决策树算法的阈值自适应色谱峰研究与实现[J]. 廖建平,单杰,李志军,陈昊旻,楚金伟,万福.  河南科技大学学报(自然科学版). 2020(02)
[2]基于人工智能的心脏疾病诊断[J]. 贺文韬.  现代商贸工业. 2020(02)
[3]21基因检测对ER阳性、淋巴结阴性乳腺癌患者术后复发转移的指导价值[J]. 顾玉琴,华燕艳.  局解手术学杂志. 2019(11)
[4]经典人工智能算法综述[J]. 陶阳明.  软件导刊. 2020(03)
[5]乳腺癌保乳手术患者不同年龄段病理特征对比及复发的危险因素分析[J]. 谢小军,刘家利.  检验医学与临床. 2019(21)
[6]脉管浸润对乳腺癌预后的影响及其发生机制[J]. 李作农,王隽,魏娜,王晓珍,朱珠,吕铮,赵刚.  中国老年学杂志. 2019(21)
[7]基于SEER数据库利用机器学习方法分析乳腺癌的预后因素[J]. 章鸣嬛,张璇,郭欣,陈瑛.  北京生物医学工程. 2019(05)
[8]三阴性乳腺癌210例临床分析[J]. 李玉龙,彭德峰,王自豪,王志军,董慧明.  蚌埠医学院学报. 2019(09)
[9]胆固醇——乳腺癌风险和预后的预测因子[J]. 陈妮娜,赵磊,曹邦伟.  肿瘤防治研究. 2019(09)
[10]新一代信息技术与乳腺癌诊治模式的变革[J]. 沈坤炜,曹健,李宏为.  外科理论与实践. 2019(05)

博士论文
[1]基于GBD大数据分析与预测中国女性乳腺癌发病与死亡趋势的研究[D]. 原瑞霞.武汉大学 2018

硕士论文
[1]基于复杂临床数据的乳腺癌新辅助化疗后病理反应的预测[D]. 李春梅.东北师范大学 2016
[2]常见乳腺癌危险因素对患者预后的影响研究[D]. 白爱丽.天津医科大学 2016
[3]决策树模型在多普勒超声诊断乳腺肿瘤应用性研究[D]. 张晓慧.南华大学 2014



本文编号:3612249

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3612249.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户01666***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com