当前位置:主页 > 科技论文 > 自动化论文 >

基于统计学习的乳腺癌诊疗延误分析预测研究

发布时间:2020-11-10 02:08
   近年来,我国乳腺癌的发病率呈现上升趋势,并严重威胁着女性的健康与生存。诊断和治疗延误在乳腺癌中普遍存在,并可能导致乳腺癌患者出现不良的临床表征及预后。研究乳腺癌的诊疗延误,发现影响延误的主要因素并有针对性的采取措施,对乳腺癌患者的及时就诊与治疗,提高乳腺癌患者的生存率具有重要意义。本文对大连地区298名乳腺癌患者的临床数据进行了分析,以回顾性队列研究为研究手段,基于统计学习方法对乳腺癌诊疗延误的分析及预测方法进行了研究,主要包括以下三方面工作:(1)基于生存分析对患者发生诊疗延误的时间节点进行界定。现有的研究大多完全依靠专家经验来界定延误时间,没有建立合适的统计论证方法。而本研究基于本地临床数据进行生存分析,根据对数秩检验的p值界定延误。然后根据延误分类对生存数据分组绘制Kaplan-Meier生存曲线,并使用Cox模型对所得结果进行进一步验证。(2)基于~2检验、方差分析和逻辑回归分析对患者的延误与其临床表征、社会人口因素进行关联分析,以寻找与发生延误关系最为密切的因素。本文首先对患者的临床表征与延误进行关联分析,以论述延误对患者具体癌症表征的影响,并进一步验证延误定义的合理性;接着寻找影响延误的社会人口因素并根据多重逻辑回归得出独立的影响因素;最后结合本地经济及社会具体情况,对所得结果进行分析并对患者、政府或医疗机构提出减轻延误的建议。(3)基于集成学习建立分类模型用于预测患者的延误倾向。本次研究以患者的临床表征与社会人口因素为因变量,提出了一种基于集成学习的预测算法,该算法以逻辑回归为基学习器,并使用梯度提升法将基学习器进行集成得到强分类器,从而对是否发生延误进行预测。本文通过生存分析界定乳腺癌延误为患者诊疗时间大于1个月的情形,结果具有统计学意义,该结论对大连地区医院的临床治疗具有参考价值;关联分析结果表明患者的延误对其临床表征有显著影响,且患者的夫妻感情、收入水平、首诊医院等级和保健措施情况等社会影响因素与发生延误有较为密切的关系,该结果对患者、医疗机构和政府实施降低乳腺癌延误的措施提供了科学依据;本文还将所提出的模型与常见分类模型与集成学习方法进行比较,结果表明本文算法具有更好的预测效果。
【学位单位】:大连理工大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP181;R737.9
【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
        1.1.1 乳腺癌的诊断与治疗延误
        1.1.2 回顾性队列研究
        1.1.3 课题研究意义
    1.2 研究现状及分析
    1.3 主要研究内容及本文结构
2 数据的预处理
    2.1 数据来源与内容
    2.2 数据标签的定义及统计特征
        2.2.1 数据标签的定义
        2.2.2 数据的统计特征
    2.3 生存数据
    2.4 本章小结
3 基于生存分析的延误界定
    3.1 生存分析基本概念
    3.2 Kaplan-Meier方法
    3.3 生存差异分析
        3.3.1 假设检验
        3.3.2 Log-rank检验
    3.4 Cox比例风险模型
    3.5 延误时间的界定
    3.6 本章小结
4 患者延误的关联分析
    4.1 临床数据的关联分析方法及评价标准
2检验'>        4.1.1 X2检验
        4.1.2 ANOVA
        4.1.3 比值比
    4.2 临床表征因素相关分析
    4.3 社会人口因素相关分析
        4.3.1 单因素分析
        4.3.2 基于多重逻辑回归的多因素分析
        4.3.3 患者心理因素及首诊医院相关分析
    4.4 结果分析
    4.5 本章小结
5 基于集成学习的延误模型构建
    5.1 基于后向选择法的逻辑回归模型构建
        5.1.1 逻辑回归
        5.1.2 基于逻辑回归的延误模型构建
    5.2 模型的训练及评估
    5.3 集成学习
        5.3.1 Bagging
        5.3.2 Boosting
    5.4 基于梯度提升算法的延误判别模型构建
    5.5 结果分析
    5.6 本章小结
结论与展望
参考文献
致谢

【相似文献】

相关期刊论文 前10条

1 李杏;;生存分析的基本方法及其运用[J];华南预防医学;2016年05期

2 ;医生小词典——生存分析[J];临床合理用药杂志;2015年30期

3 井艳梅;冯娜娜;;肿瘤随访资料的生存分析方法[J];健康之路;2016年08期

4 罗胜兰;俞敏;;生存分析的方法及应用[J];浙江预防医学;2013年05期

5 张欣峰;娄清涛;陆建邦;全培良;孙喜斌;;现时生存分析方法的应用实践与评价[J];中国卫生统计;2011年01期

6 梁正东;;三种多元生存分析方法的比较[J];中国卫生统计;1991年02期

7 ;名词解释:Cox回归,截尾数据[J];福建医学院学报;1987年02期

8 方积乾;;多状态生存分析[J];医学研究通讯;1987年07期

9 方积乾;;生存分析的概念与方法学[J];自然杂志;1988年11期

10 杨宇;;生存分析[J];中国卫生统计;1989年01期


相关博士学位论文 前10条

1 毛光才;生存分析中若干非参数统计推断问题研究[D];武汉大学;2018年

2 余吉昌;生存分析中有偏抽样和观测研究中因果推断问题的研究[D];武汉大学;2013年

3 骆福添;Cox模型应用基础及其扩展模型研究[D];中山医科大学;1991年

4 赵自强;生存分析中有关特殊设计的若干问题研究[D];复旦大学;2013年

5 环梅;基于生存分析的信号交叉口非机动车穿越行为研究[D];北京交通大学;2014年

6 刘吉彩;生存数据统计模型的变量选择方法[D];华东师范大学;2014年

7 王世勇;恶性神经上皮肿瘤的血管生成拟态及其对患者预后的影响分析[D];南方医科大学;2013年

8 魏自儒;我国新出口市场中企业的进入顺序与出口表现研究[D];清华大学;2013年

9 周儒;老年胃癌患者手术治疗风险与疗效评价及巨噬细胞相关集落刺激因子作为新型肿瘤标志物的探索[D];复旦大学;2012年

10 浦飞飞;T细胞免疫球蛋白粘蛋白3在骨肉瘤中的表达及作用研究[D];华中科技大学;2017年


相关硕士学位论文 前10条

1 刘长东;基于统计学习的乳腺癌诊疗延误分析预测研究[D];大连理工大学;2019年

2 张梦洁;基于生存分析的公交停靠耗费时间影响因素研究[D];西南交通大学;2019年

3 路文馨;基于比例风险模型的生存分析研究[D];华南理工大学;2019年

4 陈达;基于生存分析的P2P借贷平台借款人信用风险评估[D];杭州电子科技大学;2019年

5 闫雪;基于生存分析的网贷项目满标效率影响因素研究[D];哈尔滨工业大学;2019年

6 梁霖;私人转移支付对我国贫困持续性的影响[D];山东大学;2019年

7 唐静;基于生存分析法的P2P网络借贷平台风险管理研究[D];武汉科技大学;2019年

8 刘畅;基于生存分析的中国ST企业的研究[D];山东大学;2019年

9 郑瑶;EGFR突变晚期NSCLC患者临床特征及生存分析[D];西安医学院;2019年

10 宋秘;肾透明细胞癌组织中G6PD、VEGF的表达与预后生存分析[D];昆明医科大学;2018年



本文编号:2877305

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2877305.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户23eff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com