当前位置:主页 > 科技论文 > 软件论文 >

基于随机森林的心脏病预测平台的设计与实现

发布时间:2020-11-11 11:33
   随着移动互联网医疗时代的到来,增加了大数据的积累,而大数据的发展又促进了医疗的进步,如何将大数据与移动互联网医疗相结合是未来智能医疗领域发展的重中之重。本文将数据挖掘与移动医疗APP相结合,设计并实现了基于随机森林的心脏病预测平台,该平台围绕随机森林算法改进、平台架构设计与实现以及平台性能评估展开,主要工作和研究内容如下:(1)针对随机森林算法数据不平衡、个体分类器单一、大规模数据扩展性差等缺点,提出了三点改进方案——1、利用Bootstrap对数据集进行多层次抽取确保数据的平衡;2、采用聚类思想对个体分类器进行聚类分簇,从每个簇中选出一个代表性分类器组成多样性森林;3、借助Hadoop的分布式计算能力实现随机森林的并行化构建。依据提出的方案设计了 BDRF(Balanced And Diversity Random Forest)算法。(2)对平台进行需求分析,并给出具体设计方案。APP展示平台完成与业务功能对应的原型界面设计;后台服务器主要完成SSH(Spring+ SpringMVC +Hibernate)框架逻辑设计、数据库方案设计以及心脏病预测模型中HDFS与MySQL数据整合设计。其中后台逻辑设计采用MVC模式,降低层与层之间的耦合,便于平台业务功能的扩展;HDFS与MySQL通过sqoop(SQL-to-Hadoop)进行数据互导,数据统一存入MySQL,方便数据的查询和管理工作。(3)实现平台各个业务模块,对其实现效果进行展示,并依据UCI(University of California Irvine)心脏病数据集分别对决策树算法、随机森林算法和BDRF算法进行建模分析,验证本文心脏病预测平台的有效性和性能的提升。
【学位单位】:北京邮电大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP311.56;TP311.13
【部分图文】:

生态体系,最顶层,工具,分布式文件系统


宝开始去除IOE化,研宄基于Hadoop的系统?云梯。到目前为止,除HDFS??与MapReduce夕卜,Hadoop生态体系中新增了多个成员?Hbase、Hive、sqoop??和ZooKeeper等,如图2-丨所示:??I?1?1?1??ETL?Tools?j?BI?Reporting?J?RDBMS????1?1?l??Pig?.??(数据流)?mve?Sqoop??Map/Reduce??(任务调度/执行系统)??Zooke????-eper??Hbase??HDFS??(Hadoop分布式文件系统)??图2-1?Hadoop生态体系??1)?Hive是基于Hadoop的一个工具,建立在Hadoop集群的最顶层,对存储??7??

架构图,架构,分布式存储


北京邮电大学工程硕士学位论文p群上的数据提供类SQL的接口进行操作。它可以将sql语句自duce任务运行,简化了数据查询工作。??oop是Apache的一个独立子项目,负责Hadoop与关系型数据库(SQL)间数据互导,便于使用者快速迭代幵发。??oop基本结构模型??oopM是一个能够对大规模数据进行分布式存储和计算的架构,它布式处理的细节,只需设置好参数,就能让用户轻松开发分布式op主要由两个部分构成——HDFS和MapReduce。HDFS在架数据文件的分布式存储。MapReduce在HDFS上一层,负责调用并行化处理。其结构如图2-2所示。下面将分别详细介绍HDce?〇??

基于随机森林的心脏病预测平台的设计与实现


图2-3?HDFS结构??
【相似文献】

相关期刊论文 前10条

1 陈一诺;董绍华;;基于随机森林算法的管道缺陷预测方法[J];油气储运;年期

2 刘阳;杜华军;岳子涵;马杰;吕武;;基于随机森林的无人机检测方法[J];计算机工程与应用;年期

3 胡蝶;;基于随机森林的债券违约分析[J];当代经济;2018年03期

4 温博文;董文瀚;解武杰;马骏;;基于改进网格搜索算法的随机森林参数优化[J];计算机工程与应用;2018年10期

5 赵艺淞;杨昆;王保云;黎晓路;;随机森林在城市不透水面提取中的应用研究[J];云南师范大学学报(自然科学版);2017年03期

6 吴辰文;梁靖涵;王伟;李长生;;一种顺序响应的随机森林:变量预测和选择[J];小型微型计算机系统;2017年08期

7 顾娟;林敏;鞠桂玲;;基于随机森林回归的军械器材需求预测[J];自动化应用;2017年09期

8 刘迎春;陈梅玲;;流式大数据下随机森林方法及应用[J];西北工业大学学报;2015年06期

9 罗超;;面向高维数据的随机森林算法优化探讨[J];商;2016年04期

10 杨晓峰;严建峰;刘晓升;杨璐;;深度随机森林在离网预测中的应用[J];计算机科学;2016年06期


相关博士学位论文 前10条

1 王晓军;基于大数据的风洞马赫数集成建模方法的研究[D];东北大学;2016年

2 王鑫;基于随机森林的认知网络频谱感知算法研究[D];东北大学;2016年

3 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年

4 黄玥;VANET信息安全问题及异常检测技术研究[D];吉林大学;2017年

5 倪强;基于随机前沿和随机森林法的沿海开发区发展效率研究[D];天津大学;2011年

6 季斌;内蒙古浩布高地区多金属矿综合信息找矿预测研究[D];合肥工业大学;2017年

7 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年

8 金超;基于随机森林的医学影像分割算法研究及应用[D];苏州大学;2017年

9 李宝富;巨厚砾岩层下回采巷道底板冲击地压诱发机理研究[D];河南理工大学;2014年

10 赵东;基于群智能优化的机器学习方法研究及应用[D];吉林大学;2017年


相关硕士学位论文 前10条

1 叶蓓;WorldView-3数据的岩性信息自动提取方法研究[D];中国地质大学(北京);2018年

2 高聪;基于随机森林的不平衡大数据分类算法研究[D];东北电力大学;2018年

3 闫东阳;基于对象的随机森林遥感分类方法优化[D];中国地质大学(北京);2018年

4 吴卫星;随机森林在技术指标量化选股中的应用[D];电子科技大学;2018年

5 张向前;机器学习在辐射源信号指纹识别中的应用研究[D];电子科技大学;2018年

6 王梦芹;基于随机森林的个人信用评价指标分析[D];安徽大学;2018年

7 谈小雨;基于情感时序距离的文本情感分类和情感主体识别方法研究[D];安徽大学;2018年

8 苏靖宇;多因子选股模型在A股市场上的实证研究[D];安徽大学;2018年

9 刘建航;大数据环境下异常通话行为检测的研究[D];北京邮电大学;2018年

10 罗斌杰;基于随机森林的心脏病预测平台的设计与实现[D];北京邮电大学;2018年



本文编号:2879129

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2879129.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户28c3f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com