基于数据挖掘技术的2型糖尿病的预测与健康管理研究
发布时间:2025-02-05 10:32
糖尿病是最常见的慢性非传染病之一。据国际糖尿病联盟(IDF)最新统计,2017年全球糖尿病患者人数为4.25亿人。我国糖尿病患者人数高达1.144亿人,居全球首位,而诊断率仅为46.4%。其中90%的糖尿病患者为2型糖尿病患者。2型糖尿病是一种终身性疾病,可引发心脏病、血管等并发症,它不仅影响了患者的生活质量,也给患者和国家带来了沉重的经济负担。因此,需要早期预测2型糖尿病,及早发现2型糖尿病的高危人群,制定出该人群的健康管理方案,最终达到控制2型糖尿病的发病率的目的。本文基于数据挖掘技术、参数优化技术、分类器评估等相关理论以及健康体检数据和2型糖尿病患者数据,构建的2型糖尿病预测模型如下:首先,利用Weka 3.6.13软件及网格搜索算法优化支持向量机(SVM)的参数,构建了SVM预测模型。为了改进SVM预测模型的结果,使用属性约简筛选出2型糖尿病的最佳预测因子、使用AdaBoost算法组合多个基分类器,在此基础上,分别构建了属性约简-SVM预测模型和属性约简-AdaBoost-SVM预测模型。比较分析模拟数据的结果表明,属性约简和AdaBoost集成算法可同时提高预测模型的性能。其次...
【文章页数】:75 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.2.3 国内外研究现状评述
1.3 研究内容与研究方法
1.3.1 研究内容
1.3.2 研究方法
第2章 相关理论基础
2.1 健康管理概述
2.1.1 什么是健康管理
2.1.2 健康管理在国外的发生与发展
2.1.3 健康管理在我国的发生与发展
2.2 数据挖掘概述
2.2.1 数据挖掘的定义
2.2.2 数据挖掘的任务
2.2.3 数据挖掘的过程
2.3 数据挖掘算法概述
2.3.1 支持向量机算法概述
2.3.2 AdaBoost算法概述
2.4 优化支持向量机参数的算法概述
2.4.1 网格搜索算法
2.4.2 粒子群优化算法
2.4.3 遗传算法
2.5 分类器评估方法概述
2.5.1 混淆矩阵
2.5.2 一致性检验
2.5.3 ROC曲线
2.6 本章小结
第3章 基于网格搜索优化SVM的2型糖尿病预测模型
3.1 医学数据来源及预处理
3.1.1 医学数据来源
3.1.2 医学数据预处理
3.2 糖尿病预测模型的建立
3.2.1 训练样本与测试样本的选取
3.2.2 核函数的选择
3.2.3 网格搜索算法选择最佳的参数
3.2.4 SVM预测模型
3.2.5 属性约简-SVM预测模型
3.2.6 属性约简-AdaBoost-SVM预测模型
3.3 预测模型的预测结果比较与分析
3.3.1 预测模型的混淆矩阵分析
3.3.2 预测模型的一致性分析
3.3.3 预测模型的ROC曲线分析
3.3.4 预测模型的进一步讨论与分析
3.4 本章小结
第4章 基于启发式算法优化SVM的2型糖尿病预测模型
4.1 医学数据预处理
4.2 糖尿病预测模型的建立
4.2.1 训练样本和测试样本的选取
4.2.2 核函数的选择
4.2.3 粒子群优化算法选择最佳的参数
4.2.4 遗传算法选择最佳的参数
4.2.5 PSO-SVM预测模型
4.2.6 GA-SVM预测模型
4.3 糖尿病预测模型的预测结果比较与分析
4.3.1 预测模型的混淆矩阵分析
4.3.2 预测模型的一致性分析
4.3.3 预测模型的进一步讨论与分析
4.4 本章小结
第5章 2型糖尿病高危人群的健康管理方案
5.1 2型糖尿病高危人群的饮食管理方案
5.1.1 每日所需总热量的确定
5.1.2 四季饮食指导
5.2 2型糖尿病高危人群的运动管理方案
5.3 2型糖尿病高危人群的教育与心理管理方案
5.3.1 教育管理
5.3.2 心理管理
5.4 2型糖尿病高危人群的身体指标监测方案
5.5 本章小结
结论
参考文献
附录 原始实验数据
攻读硕士学位期间承担的科研项目与主要成果
致谢
本文编号:4029698
【文章页数】:75 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.2.3 国内外研究现状评述
1.3 研究内容与研究方法
1.3.1 研究内容
1.3.2 研究方法
第2章 相关理论基础
2.1 健康管理概述
2.1.1 什么是健康管理
2.1.2 健康管理在国外的发生与发展
2.1.3 健康管理在我国的发生与发展
2.2 数据挖掘概述
2.2.1 数据挖掘的定义
2.2.2 数据挖掘的任务
2.2.3 数据挖掘的过程
2.3 数据挖掘算法概述
2.3.1 支持向量机算法概述
2.3.2 AdaBoost算法概述
2.4 优化支持向量机参数的算法概述
2.4.1 网格搜索算法
2.4.2 粒子群优化算法
2.4.3 遗传算法
2.5 分类器评估方法概述
2.5.1 混淆矩阵
2.5.2 一致性检验
2.5.3 ROC曲线
2.6 本章小结
第3章 基于网格搜索优化SVM的2型糖尿病预测模型
3.1 医学数据来源及预处理
3.1.1 医学数据来源
3.1.2 医学数据预处理
3.2 糖尿病预测模型的建立
3.2.1 训练样本与测试样本的选取
3.2.2 核函数的选择
3.2.3 网格搜索算法选择最佳的参数
3.2.4 SVM预测模型
3.2.5 属性约简-SVM预测模型
3.2.6 属性约简-AdaBoost-SVM预测模型
3.3 预测模型的预测结果比较与分析
3.3.1 预测模型的混淆矩阵分析
3.3.2 预测模型的一致性分析
3.3.3 预测模型的ROC曲线分析
3.3.4 预测模型的进一步讨论与分析
3.4 本章小结
第4章 基于启发式算法优化SVM的2型糖尿病预测模型
4.1 医学数据预处理
4.2 糖尿病预测模型的建立
4.2.1 训练样本和测试样本的选取
4.2.2 核函数的选择
4.2.3 粒子群优化算法选择最佳的参数
4.2.4 遗传算法选择最佳的参数
4.2.5 PSO-SVM预测模型
4.2.6 GA-SVM预测模型
4.3 糖尿病预测模型的预测结果比较与分析
4.3.1 预测模型的混淆矩阵分析
4.3.2 预测模型的一致性分析
4.3.3 预测模型的进一步讨论与分析
4.4 本章小结
第5章 2型糖尿病高危人群的健康管理方案
5.1 2型糖尿病高危人群的饮食管理方案
5.1.1 每日所需总热量的确定
5.1.2 四季饮食指导
5.2 2型糖尿病高危人群的运动管理方案
5.3 2型糖尿病高危人群的教育与心理管理方案
5.3.1 教育管理
5.3.2 心理管理
5.4 2型糖尿病高危人群的身体指标监测方案
5.5 本章小结
结论
参考文献
附录 原始实验数据
攻读硕士学位期间承担的科研项目与主要成果
致谢
本文编号:4029698
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/4029698.html