基于多重插补的代谢综合征自我预测模型研究
发布时间:2021-04-20 20:15
代谢综合征(Metabolic syndrome,MetS)是一组复杂的多种物质代谢紊乱症候群,极易引发高血压、高血糖、高血脂等并发症。MetS通常通过医院的健康体检诊断,诊断指标包括身高、体重、腰围、血压和部分血液检测指标。但是,目前中国体检的渗透率远低于发达国家。这样的情况需要一种不依赖于医院健康检查的MetS预测方法。但是,自我管理过程中血液检测数据无法获取,这给MetS的预测带来挑战。本论文提出一种新颖的基于插补特征的MetS自我预测方法。数据集包含浙江大学医学院附属第一医院健康检查数据库91,420人次的健康检查资料。在该方法中,第一步预测出血液检测数据,第二步将血液检测数据的预测值作为补充特征用于训练出MetS预测模型。本文使用XGBoost构建了另外两种模型以对比三种方法的性能。第一种模型只使用自我可观测的特征,第二种模型使用新增的血液检测数据进行训练。在第三种模型中,MICE(multivariate imputation by chained equations)方法用于预测出血液检测数据,从而替代第二种模型的真实数据来进行训练。结果表明,与前两个模型相比,本文所提出...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 研究内容
1.4 论文组织结构
第2章 相关技术与方法
2.1 数据挖掘与机器学习技术
2.1.1 技术概念
2.1.2 挖掘任务
2.1.3 一般流程
2.1.4 分析工具
2.2 相关方法概述
2.2.1 Z-Score标准化
2.2.2 SMOTE技术
2.2.3 MICE
2.2.4 XGBoost
2.3 相关评价指标
2.3.1 混淆矩阵
2.3.2 ROC曲线和PR曲线
2.3.3 插补误差指标
第3章 代谢综合征自我预测模型研究
3.1 数据源
3.2 数据预处理
3.2.1 数据标准化
3.2.2 样本均衡
3.3 特征评分
3.4 自我预测模型构建
3.4.1 构建方法
3.4.2 模型比较
3.4.3 参数训练
3.5 自我预测模型评估
第4章 代谢综合征多场景风险评估分析
4.1 多场景风险评估模型构建
4.1.1 构建方案
4.1.2 参数训练
4.2 多场景风险评估模型评估
4.2.1 第一组模型分析
4.2.2 第二组模型分析
4.2.3 第三组模型分析
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
作者在硕士研究生期间的科研成果
【参考文献】:
期刊论文
[1]看病难现状及其影响因素浅析[J]. 焦雅辉,胡瑞荣. 中国医疗保险. 2012(03)
[2]高血压、糖尿病、血脂异常及代谢综合征与超重和肥胖关系[J]. 张雷,崔红月,刘爱萍,王培玉. 中国慢性病预防与控制. 2009(06)
[3]数据挖掘研究现状综述[J]. 王立伟. 图书与情报. 2008(05)
[4]老年男性高尿酸血症与代谢综合征各组分的相关性分析[J]. 陈蔚,张玉. 复旦学报(医学版). 2007(03)
[5]数据挖掘技术在肺癌生存期预测中的应用探讨[J]. 张晓东. 中国医院统计. 2006(04)
[6]加强多学科协作,争取心血管病研究取得新进展[J]. 臧益民,樊荣. 心脏杂志. 2006(05)
[7]医学数据挖掘的技术、方法及应用[J]. 朱凌云,吴宝明. 生物医学工程学杂志. 2003(03)
本文编号:3150330
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 研究内容
1.4 论文组织结构
第2章 相关技术与方法
2.1 数据挖掘与机器学习技术
2.1.1 技术概念
2.1.2 挖掘任务
2.1.3 一般流程
2.1.4 分析工具
2.2 相关方法概述
2.2.1 Z-Score标准化
2.2.2 SMOTE技术
2.2.3 MICE
2.2.4 XGBoost
2.3 相关评价指标
2.3.1 混淆矩阵
2.3.2 ROC曲线和PR曲线
2.3.3 插补误差指标
第3章 代谢综合征自我预测模型研究
3.1 数据源
3.2 数据预处理
3.2.1 数据标准化
3.2.2 样本均衡
3.3 特征评分
3.4 自我预测模型构建
3.4.1 构建方法
3.4.2 模型比较
3.4.3 参数训练
3.5 自我预测模型评估
第4章 代谢综合征多场景风险评估分析
4.1 多场景风险评估模型构建
4.1.1 构建方案
4.1.2 参数训练
4.2 多场景风险评估模型评估
4.2.1 第一组模型分析
4.2.2 第二组模型分析
4.2.3 第三组模型分析
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
作者在硕士研究生期间的科研成果
【参考文献】:
期刊论文
[1]看病难现状及其影响因素浅析[J]. 焦雅辉,胡瑞荣. 中国医疗保险. 2012(03)
[2]高血压、糖尿病、血脂异常及代谢综合征与超重和肥胖关系[J]. 张雷,崔红月,刘爱萍,王培玉. 中国慢性病预防与控制. 2009(06)
[3]数据挖掘研究现状综述[J]. 王立伟. 图书与情报. 2008(05)
[4]老年男性高尿酸血症与代谢综合征各组分的相关性分析[J]. 陈蔚,张玉. 复旦学报(医学版). 2007(03)
[5]数据挖掘技术在肺癌生存期预测中的应用探讨[J]. 张晓东. 中国医院统计. 2006(04)
[6]加强多学科协作,争取心血管病研究取得新进展[J]. 臧益民,樊荣. 心脏杂志. 2006(05)
[7]医学数据挖掘的技术、方法及应用[J]. 朱凌云,吴宝明. 生物医学工程学杂志. 2003(03)
本文编号:3150330
本文链接:https://www.wllwen.com/yixuelunwen/nfm/3150330.html
最近更新
教材专著