基于特征选择的结直肠癌预测模型研究
发布时间:2021-02-06 04:12
结直肠癌(colorectal cancer,CRC)是消化系统中最容易发作的癌症之一,据统计,世界上每年患该病的人数多达120万,死于该病的人数大约占据了患者人数的一半,高达60万人,不仅使人类的健康受到严重的威胁,而且使国民经济也遭受了巨大的损失。目前几种方法能够帮助医务人员对结直肠癌进行诊断,它们是:X线检查、血清癌胚抗原、B超扫描、内镜检查等,这些无疑对结直肠癌的诊断起到很大作用,但是这些方法都依赖于医生的经验,难以确保准确性,同时也增加了医务人员的工作强度。针对以上结直肠癌诊断方法的局限性,融入机器学习算法的预测模型逐步成为研究的热点。机器学习算法在疾病预测领域的智能性表现为主动地对医疗数据进行学习,更重要的是根据构建的多个模型做出最终的决策,对提高疾病诊断的准确性、实时性,减轻医务人员的工作强度具有重大意义。尽管如此,单一的机器学习算法对不同的数据分类预测时未必都能得到可观的效果,必须综合考虑多种技术的融合和优化。目前,利用机器学习算法对结直肠癌进行预测主要存在疾病特征因素冗余、特征选取不当、分类器选择不当以及数据样本不平衡等问题,导致一些机器学习算法在诊断结直肠癌的过程中...
【文章来源】:山东师范大学山东省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
ROC曲线示意图
(b) 多项式核函数全局特性 图 2-3 不同核函数寻优特性数的局部特性, =0.1,0.2,0.3,0.4,0. 试点较远的样本受函数的影响较小2-3(b)表示多项式的全局特性,d=不同时,仍存在很大影响,这说明2-3(c)是混合核函数的综合特性,2-3 中不同核函数性能的比较,我性与多项式核函数的全局性能,从器学习和数据科学中最为广泛使用随机森林是由若干个决策树通过组
icutes 1.086 0.394 7.586 1 0.006eroidetes 1.702 0.531 10.028 1 0.001 1.220 0.502 6.187 1 0.0400.942 0.395 5.692 1 0.017tant -17.756 3.802 21.814 1 0.000特征选取结果于说明二元分类器系统的诊断能力,随着 ROC 曲线接近左疾病诊断的效果越好。在 3.5.1 节中,我们利用二元 Logisroidetes,BIM 和 age 四种因素与结直肠有关,但是,究竟是组合因素对于该病诊断效果好,我们利用 ROC 曲线进ogistic 回归模型的 ROC 曲线。表 3-2 中列出了单因素和组C 值。由图 3-2 和表 3-2 可以看出,Firmicutes,Bacteroidet 为 0.942,比其他单因素的各项指标更接近 1,这说明组合好一些。
【参考文献】:
期刊论文
[1]不同年龄组的结直肠癌临床流行病学分析[J]. 阮丽琴,李太原,周凤凤. 实用临床医学. 2016(04)
[2]结直肠癌的发生与饮食构成因素关系的研究进展[J]. 宋美璇,李显蓉. 中国普外基础与临床杂志. 2015(09)
[3]MMP7启动子区基因多态性分布与结直肠癌相关性的研究[J]. 王琛,黎华,宗亚光,娄喻童,张好刚. 哈尔滨医科大学学报. 2015(03)
[4]饮食因素影响结直肠癌发生的研究进展[J]. 陈辰,房静远. 中华医学杂志. 2014 (26)
[5]DR对于肺部小结节的检测ROL分析研究[J]. 杨文芳. 临床肺科杂志. 2012(10)
[6]结直肠癌实验研究现状及展望[J]. 王磊,宋顺心,汪建平. 中华实验外科杂志. 2013 (03)
硕士论文
[1]RUSBoost算法在不平衡数据集上的应用[D]. 尹絮童.大连理工大学 2018
[2]面向健康评估的机器学习方法研究与应用[D]. 赵家英.电子科技大学 2016
本文编号:3020128
【文章来源】:山东师范大学山东省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
ROC曲线示意图
(b) 多项式核函数全局特性 图 2-3 不同核函数寻优特性数的局部特性, =0.1,0.2,0.3,0.4,0. 试点较远的样本受函数的影响较小2-3(b)表示多项式的全局特性,d=不同时,仍存在很大影响,这说明2-3(c)是混合核函数的综合特性,2-3 中不同核函数性能的比较,我性与多项式核函数的全局性能,从器学习和数据科学中最为广泛使用随机森林是由若干个决策树通过组
icutes 1.086 0.394 7.586 1 0.006eroidetes 1.702 0.531 10.028 1 0.001 1.220 0.502 6.187 1 0.0400.942 0.395 5.692 1 0.017tant -17.756 3.802 21.814 1 0.000特征选取结果于说明二元分类器系统的诊断能力,随着 ROC 曲线接近左疾病诊断的效果越好。在 3.5.1 节中,我们利用二元 Logisroidetes,BIM 和 age 四种因素与结直肠有关,但是,究竟是组合因素对于该病诊断效果好,我们利用 ROC 曲线进ogistic 回归模型的 ROC 曲线。表 3-2 中列出了单因素和组C 值。由图 3-2 和表 3-2 可以看出,Firmicutes,Bacteroidet 为 0.942,比其他单因素的各项指标更接近 1,这说明组合好一些。
【参考文献】:
期刊论文
[1]不同年龄组的结直肠癌临床流行病学分析[J]. 阮丽琴,李太原,周凤凤. 实用临床医学. 2016(04)
[2]结直肠癌的发生与饮食构成因素关系的研究进展[J]. 宋美璇,李显蓉. 中国普外基础与临床杂志. 2015(09)
[3]MMP7启动子区基因多态性分布与结直肠癌相关性的研究[J]. 王琛,黎华,宗亚光,娄喻童,张好刚. 哈尔滨医科大学学报. 2015(03)
[4]饮食因素影响结直肠癌发生的研究进展[J]. 陈辰,房静远. 中华医学杂志. 2014 (26)
[5]DR对于肺部小结节的检测ROL分析研究[J]. 杨文芳. 临床肺科杂志. 2012(10)
[6]结直肠癌实验研究现状及展望[J]. 王磊,宋顺心,汪建平. 中华实验外科杂志. 2013 (03)
硕士论文
[1]RUSBoost算法在不平衡数据集上的应用[D]. 尹絮童.大连理工大学 2018
[2]面向健康评估的机器学习方法研究与应用[D]. 赵家英.电子科技大学 2016
本文编号:3020128
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3020128.html