当前位置:主页 > 医学论文 > 医卫管理论文 >

随机森林算法的改进及其在慢性病预警模型中的应用研究

发布时间:2021-11-17 02:44
  医疗资料显示,慢性病已经成为危害人类健康最严重的疾病之一。慢性病的一个特点是很难事先做出准确的诊断,但其发生和发展有一定规律可循。慢性病的诊断本质上是机器学习中的数据分类问题。借助机器学习技术能够挖掘慢性病诊断的各种规律和联系,帮助医生建立疾病预警模型。本文提出基于优化线性组合核极限学习机的随机森林算法并将其用于慢性病的分类问题之中,旨在进一步提高慢性病诊断准确率,为医生在临床诊断中提供参考依据。从研究人员利用不同的模型对慢性病数据分类的结果显示,基于支持向量机(SVM)和人工神经网络(ANN)的模型表现出较好的分类性能,但存在模型参数选择困难、单分类器的性能瓶颈、训练速度慢以及不能处理海量医疗数据等缺陷。针对它们存在的局限性,提出了一种基于优化线性组合核极限学习机的随机森林分类算法。主要研究内容如下:1.针对医疗数据不规则、不平坦的问题,本文采用RBF核函数和多项式核函数的线性组合作为核极限学习机的核函数。基于核方法的分类模型的核类型与训练数据有很大的关系,线性组合核不仅能够合理发挥各核函数的优点来充分适应训练数据,而且能降低核类型对模型分类性能的影响。针对模型参数人为难以选择问题,... 

【文章来源】:北京工业大学北京市 211工程院校

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 研究内容
    1.4 论文组织结构
第2章 相关技术概述
    2.1 相关分类算法
        2.1.1 经典极限学习机算法
        2.1.2 核极限学习机
    2.2 粒子群优化算法
    2.3 随机森林算法
        2.3.1 Bootstrap法重采样
        2.3.2 随机森林算法流程
    2.4 Hadoop平台介绍
        2.4.1 HDFS介绍
        2.4.2 Map-Reduce介绍
    2.5 本章小结
第3章 基于优化核极限学习机的随机森林分类算法
    3.1 问题分析
    3.2 改进的随机森林分类算法
        3.2.1 核函数的选取
        3.2.2 初始化基于核极限学习机的随机森林模型
        3.2.3 优化初始随机森林模型
    3.3 并行化随机森林模型
        3.3.1 并行化思路
        3.3.2 并行化详细过程
    3.4 本章小结
第4章 改进随机森林算法在乳腺癌诊断中的应用
    4.1 数据预处理
        4.1.1 数据特征描述
        4.1.2 数据归一化处理
    4.2 对比实验设置
    4.3 实验参数设置
    4.4 实验结果分析
    4.5 模型性能评估
    4.6 本章小结
第5章 基于大数据平台的慢性病预警原型系统的实现
    5.1 系统架构
    5.2 数据采集与处理
    5.3 模型构建及并行化
        5.3.1 个体预警与群体预警
        5.3.2 随机森林算法
        5.3.3 K-Means算法
        5.3.4 Apriori算法
    5.4 本章小节
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢


【参考文献】:
期刊论文
[1]基于Hadoop的Apriori改进算法研究[J]. 黄剑,李明奇,郭文强.  计算机科学. 2017(07)
[2]基于Hadoop的医疗大数据分析系统的研究与设计[J]. 廖亮,虞宏霄.  计算机系统应用. 2017(04)
[3]集成优化核极限学习机的冠心病无创性诊断[J]. 马超,徐守祥,刘远东.  计算机应用研究. 2017(06)
[4]我国慢性病管理现状、问题及发展建议[J]. 吕兰婷,邓思兰.  中国卫生政策研究. 2016(07)
[5]基于进化算法优化的混合核极限学习机建模[J]. 张德全,魏忠军,汤健,赵立杰.  控制工程. 2013(06)
[6]冠心病智能诊断算法仿真研究[J]. 陈刚,刘秉权,葛金虎.  计算机仿真. 2012(12)
[7]基于云计算平台Hadoop的并行k-means聚类算法设计研究[J]. 赵卫中,马慧芳,傅燕翔,史忠植.  计算机科学. 2011(10)
[8]基于支持向量机和人工神经网络的心血管疾病中医证候分类识别研究[J]. 许朝霞,王忆勤,颜建军,郭睿,刘国萍,燕海霞,李福凤,徐琎,郝一鸣,钱鹏.  北京中医药大学学报. 2011(08)
[9]人工神经网络在乳腺癌诊断中的应用[J]. 金强,高普中.  计算机仿真. 2011(06)
[10]应用人工神经网络预测个体患原发性高血压病危险度[J]. 周水红,聂绍发,王重建,魏晟,许奕华,李雪华,宋恩民.  中华流行病学杂志. 2008 (06)

博士论文
[1]核极限学习机的理论与算法及其在图像处理中的应用[D]. 李小冬.浙江大学 2014

硕士论文
[1]基于遗传算法和加权极限学习机结合的乳腺癌亚型分类和基因选择[D]. 匡佳青.吉林大学 2017
[2]基于逻辑回归关联规则的疾病预警模型[D]. 王敏虾.山东大学 2016
[3]基于Hadoop的医疗辅助诊断系统的设计与实现[D]. 周羿阳.东华大学 2016



本文编号:3500055

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3500055.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a50d3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com