当前位置:主页 > 科技论文 > 自动化论文 >

基于代价敏感学习的乳腺癌预测模型研究及应用

发布时间:2021-02-28 06:37
  乳腺癌是全球女性发病率居首位的恶性肿瘤,对女性健康、国民经济和社会发展都造成了极大的影响,已成为当前社会的重大公共卫生问题。乳腺癌发病隐匿,确切病因尚未完全明确,一般认为与遗传、生育、行为生活习惯等多种内在和外界的因素共同作用有关。早期乳腺癌通过规范化治疗,治愈率较高;中晚期乳腺癌虽可延长患者生存期,却难以彻底治愈。由于人们早发现、早诊断、早治疗的健康意识淡薄,加之我国人口众多、医疗卫生资源有限等因素,很难实现全国范围内的乳腺癌筛查工作。因此开展乳腺癌预测模型的研究,及时筛选出乳腺癌高危人群,从而有的放矢显得尤为重要。课题引入代价敏感学习算法,对乳腺癌预测模型进行研究,进而实现对高危人群的筛选,达到乳腺癌辅助检测的目的。本文的主要工作内容如下:(1)数据分析。课题收集并整理1031位就诊者的临床诊疗数据。分别对训练数据(数据集1)中定量因素之间的独立性,以及各因素在病例组和对照组之间的差异性进行分析。将具有统计学意义的影响因素变量纳入乳腺癌危险因素中,并组建新的实验数据集(数据集2)。(2)提出了一种基于阈值优化Logistic回归的乳腺癌预测模型。针对实验数据存在的不平衡问题,实验采... 

【文章来源】:济南大学山东省

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

基于代价敏感学习的乳腺癌预测模型研究及应用


全球女性的癌症发病率和死亡率分布

乳腺癌,危险因素,病因,研究者


基于代价敏感学习的乳腺癌预测模型研究及应用第二章 相关知识与技术介绍 2.1 节介绍了乳腺癌病因以及筛查方法,2.2 节是对数据挖掘工具 R 数据层面和算法层面阐述代价敏感学习算法,2.4 节对数据分析使用的介绍。腺癌病因及筛查方法乳腺由皮肤、纤维组织、乳腺腺体和脂肪组成,乳腺癌是发生在乳腺肿瘤。在通常情况下,乳腺腺上皮细胞以有序方式分裂和生长。但有因,一些细胞发生基因突变,细胞增生失控,表现为无序、无限制的逐渐形成乳腺癌。

分布情况,缺失,原始数据,分布情况


基于代价敏感学习的乳腺癌预测模型研究及应用中存在的脏数据进行处理。常见数据挖掘工作中,脏数据主要是指缺失值以及异常值。数据中存在缺失值、异常值都将严重影响数据挖掘建模的执行效率,并导致挖掘结果的偏差,所以对数据进行预处理就显得尤为重要。3.2.1 缺失值处理在进行缺失值处理之前,首先对数据进行过滤,即去除唯一属性,唯一属性通常指id 属性,这些属性不能描述样本自身的分别规律,故剔除 id 属性即可。存在缺失数据时,首先需要对数据的缺失模式进行判断,然后确定处理的方法。数据缺失情况如图 3.1 所示,第一行左侧,‘650’代表有 650 条记录是完全没有缺失值的;第二行左侧,‘381’代表有 381 条记录仅 alcohol.cat 变量存在缺失值。

【参考文献】:
期刊论文
[1]结合代价敏感半监督集成学习的糖尿病视网膜病变分级[J]. 任福龙,曹鹏,万超,赵大哲.  计算机应用. 2018(07)
[2]2014年中国女性乳腺癌发病与死亡分析[J]. 李贺,郑荣寿,张思维,曾红梅,孙可欣,夏昌发,杨之洵,陈万青,赫捷.  中华肿瘤杂志. 2018 (03)
[3]基于Boosting的代价敏感软件缺陷预测方法[J]. 杨杰,燕雪峰,张德平.  计算机科学. 2017(08)
[4]上海市女性乳腺癌危险因素分析与风险预测模型研究[J]. 吴菲,何丹丹,赵根明,方红,徐望红.  中华肿瘤防治杂志. 2017(12)
[5]基于机器学习的三阴乳腺癌预测模型[J]. 董华,马岚.  云南大学学报(自然科学版). 2017(S1)
[6]乳腺癌筛查技术的进展[J]. 蔡卓君.  中国现代药物应用. 2016(06)
[7]西部二级城市女性乳腺癌发病风险相关因素分析及风险预测模型的建立[J]. 徐卫云,赵洁玉,张靖,赵丽娟,林华,陈湘,李科,杨小林.  中国普外基础与临床杂志. 2013(10)
[8]乳腺癌检查与治疗的新趋势[J]. 杨立果.  求医问药. 2012(10)
[9]SMOTE算法在不平衡数据中的应用[J]. 孙涛,吴海丰,梁志刚,贺文,张镭,吕平欣,郭秀花.  北京生物医学工程. 2012 (05)
[10]潍坊地区乳腺癌发生的危险因素调查分析[J]. 侯争光,李国楼,马晓东.  临床合理用药杂志. 2012(04)

博士论文
[1]CUL4A促进乳腺癌细胞上皮间质转化及侵袭转移的作用机制研究[D]. 王允山.山东大学 2014

硕士论文
[1]西藏地区藏族女性乳腺癌发病影响因素研究及风险评分模型的初步构建[D]. 段文鑫.西藏大学 2018
[2]基于集成代价敏感分类方法的客户流失预测研究[D]. 石瀚凌.重庆大学 2011



本文编号:3055471

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3055471.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3720d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com