基于数据挖掘的孕期高血压研究
发布时间:2021-04-14 20:11
妊娠高血压及其并发症作为孕产妇死亡的第二大影响因素,给孕产妇和新生儿带来严重威胁。该疾病多于妊娠20周后的高血压、蛋白尿为显著特征,同时损害身体中其它器官和系统,不仅会影响胎儿母体内生长发育,甚至会造成母婴死亡,是导致孕产妇和胎儿死亡的主要原因之一。目前,业内还没有研究能够完全明确其发病机制和影响因素。在这一背景下,本文采用数据挖掘的方法,对孕期高血压展开研究。论文的内容主要分为三个部分:(1)基于随机森林和xgboost的妊娠高血压研究第一部分首先对孕期高血压数据进行预处理,包括数据清洗,去重,处理缺失数据和属性规约等,最后进行数据转换和建模分析。本章使用了随机森林和Xgboost两种机器学习模型对孕期高血压数据进行建模分析并对特征进行了评分。实验发现血压和病人身高体重指数的特征分数比钙元素,钠元素,红细胞数目和血红蛋白的特征分数大,在疾病的预测中起到很大的作用。我们发现随机森林模型准确率为82.5%,比XgBoost高约3个百分点,但是XgBoost训练速度比随机森林要快。(2)基于融合模型的妊娠高血压分类预测鉴于传统模型无法完全发现孕期高血压数据潜在的规律,为了发挥各种模型的优点...
【文章来源】:南京邮电大学江苏省
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及研究意义
1.2 研究现状
1.3 论文主要研究工作及安排
第二章 孕期高血压及数据挖掘简介
2.1 妊娠高血压概述
2.1.1 妊娠高血压发病机制探讨
2.1.2 妊娠高血压临床表现
2.1.3 妊娠高血压的诊断与治疗
2.2 数据挖掘简介
2.2.1 分类与回归
2.2.2 关联规则
2.2.3 聚类分析
2.3 数据挖掘流程
2.3.1 数据预处理
2.3.2 建模分析
2.3.3 模型评价
2.4 本章小结
第三章 孕期高血压数据挖掘
3.1 数据集与预处理
3.1.1 数据来源
3.1.2 数据预处理
3.1.3 特征选择
3.1.4 实验环境简介
3.2 随机森林算法
3.2.1 随机森林简介
3.2.2 随机森林建模流程
3.2.3 随机森林模型参数
3.2.4 随机森林模型性能分析
3.3 Xgboost算法
3.3.1 XGBoost原理简介
3.3.2 XGBoost的优点
3.3.3 XGBoost建模流程
3.3.4 XGBoost算法参数
3.3.5 XgBoost模型性能分析
3.4 本章小结
第四章 基于融合模型的孕期高血压研究
4.1 集成学习概述
4.2 融合模型建模流程
4.3 融合模型的性能分析
4.4 本章小结
第五章 基于java web的孕期数据采集预测系统实现
5.1 Web开发简介
5.2 开发工具及使用技术简介
5.2.1 开发工具
5.2.2 前端页面技术
5.2.3 服务器端技术简介
5.3 系统的设计与实现
5.4 孕期数据采集系统功能展示
5.4.1 用户注册与登录
5.4.2 查看任务列表
5.4.3 病人信息录入与查看
5.4.4 管理员界面
5.5 本章小结
第六章 总结与展望
参考文献
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间参加的科研项目
致谢
【参考文献】:
期刊论文
[1]数据归约效果评估方法研究[J]. 康睿智,郝文宁. 计算机工程与应用. 2016(15)
[2]随机森林方法研究综述[J]. 方匡南,吴见彬,朱建平,谢邦昌. 统计与信息论坛. 2011(03)
[3]360例妊娠期高血压疾病及其并发症妊娠结局分析[J]. 沈舒,王选华. 中国优生与遗传杂志. 2010(12)
[4]中国高血压病流行病学及影响因素研究进展[J]. 种冠峰,相有章. 中国公共卫生. 2010(03)
[5]基于2型糖尿病数据挖掘的中医证候诊断标准模型建立研究[J]. 李建生,胡金亮,王永炎. 中国中医基础医学杂志. 2008(05)
[6]甲型肝炎风险预测中Apriori关联规则应用[J]. 关鹏,曲波,何苗,黄德生,周宝森. 中国公共卫生. 2007(02)
[7]尿液中胎盘生长因子与先兆子痫的发病风险[J]. Levine R.J,Thadhani R,S.A. Karumanchi,宁亮. 世界核心医学期刊文摘(妇产科学分册). 2005(05)
[8]基于数据挖掘技术的骨肿瘤诊断知识的自动获取[J]. 张辉,李军,钱宗才,屈景辉,范清宇. 第四军医大学学报. 2004(07)
[9]一种基于模糊聚类分析的疾病电脑预测诊断方法[J]. 吕晓燕,郭建军,李祥生. 电脑开发与应用. 2003(12)
[10]J2EE平台上MVC设计模式的研究与实现[J]. 陆荣幸,郁洲,阮永良,王志强. 计算机应用研究. 2003(03)
本文编号:3137943
【文章来源】:南京邮电大学江苏省
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及研究意义
1.2 研究现状
1.3 论文主要研究工作及安排
第二章 孕期高血压及数据挖掘简介
2.1 妊娠高血压概述
2.1.1 妊娠高血压发病机制探讨
2.1.2 妊娠高血压临床表现
2.1.3 妊娠高血压的诊断与治疗
2.2 数据挖掘简介
2.2.1 分类与回归
2.2.2 关联规则
2.2.3 聚类分析
2.3 数据挖掘流程
2.3.1 数据预处理
2.3.2 建模分析
2.3.3 模型评价
2.4 本章小结
第三章 孕期高血压数据挖掘
3.1 数据集与预处理
3.1.1 数据来源
3.1.2 数据预处理
3.1.3 特征选择
3.1.4 实验环境简介
3.2 随机森林算法
3.2.1 随机森林简介
3.2.2 随机森林建模流程
3.2.3 随机森林模型参数
3.2.4 随机森林模型性能分析
3.3 Xgboost算法
3.3.1 XGBoost原理简介
3.3.2 XGBoost的优点
3.3.3 XGBoost建模流程
3.3.4 XGBoost算法参数
3.3.5 XgBoost模型性能分析
3.4 本章小结
第四章 基于融合模型的孕期高血压研究
4.1 集成学习概述
4.2 融合模型建模流程
4.3 融合模型的性能分析
4.4 本章小结
第五章 基于java web的孕期数据采集预测系统实现
5.1 Web开发简介
5.2 开发工具及使用技术简介
5.2.1 开发工具
5.2.2 前端页面技术
5.2.3 服务器端技术简介
5.3 系统的设计与实现
5.4 孕期数据采集系统功能展示
5.4.1 用户注册与登录
5.4.2 查看任务列表
5.4.3 病人信息录入与查看
5.4.4 管理员界面
5.5 本章小结
第六章 总结与展望
参考文献
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间参加的科研项目
致谢
【参考文献】:
期刊论文
[1]数据归约效果评估方法研究[J]. 康睿智,郝文宁. 计算机工程与应用. 2016(15)
[2]随机森林方法研究综述[J]. 方匡南,吴见彬,朱建平,谢邦昌. 统计与信息论坛. 2011(03)
[3]360例妊娠期高血压疾病及其并发症妊娠结局分析[J]. 沈舒,王选华. 中国优生与遗传杂志. 2010(12)
[4]中国高血压病流行病学及影响因素研究进展[J]. 种冠峰,相有章. 中国公共卫生. 2010(03)
[5]基于2型糖尿病数据挖掘的中医证候诊断标准模型建立研究[J]. 李建生,胡金亮,王永炎. 中国中医基础医学杂志. 2008(05)
[6]甲型肝炎风险预测中Apriori关联规则应用[J]. 关鹏,曲波,何苗,黄德生,周宝森. 中国公共卫生. 2007(02)
[7]尿液中胎盘生长因子与先兆子痫的发病风险[J]. Levine R.J,Thadhani R,S.A. Karumanchi,宁亮. 世界核心医学期刊文摘(妇产科学分册). 2005(05)
[8]基于数据挖掘技术的骨肿瘤诊断知识的自动获取[J]. 张辉,李军,钱宗才,屈景辉,范清宇. 第四军医大学学报. 2004(07)
[9]一种基于模糊聚类分析的疾病电脑预测诊断方法[J]. 吕晓燕,郭建军,李祥生. 电脑开发与应用. 2003(12)
[10]J2EE平台上MVC设计模式的研究与实现[J]. 陆荣幸,郁洲,阮永良,王志强. 计算机应用研究. 2003(03)
本文编号:3137943
本文链接:https://www.wllwen.com/yixuelunwen/fuchankeerkelunwen/3137943.html
最近更新
教材专著