当前位置:主页 > 医学论文 > 妇产科论文 >

级联GA-CatBoost在妊娠期糖尿病预测诊断中的研究

发布时间:2021-02-07 04:57
  随着信息智能化进程不断发展,互联网与传统医疗不断融合,数据挖掘和机器学习技术已经越来越频繁地被用于预测疾病发生的可能性。在医疗诊断领域,越来越多的生理指标、疾病类型和生物工程技术,加大了医生诊断疾病的难度,针对该问题,机器学习和数据挖掘技术能够从医学数据中提取隐藏的、具有潜在价值的和新颖的信息,以提高诊断准确性,减少时间和成本。一方面可以对医生的诊断结果提供进一步的验证,另一方面还能给医生提供一个复杂疾病的分析工具。CatBoost(Category Boosting)是一种基于梯度提升树并且支持类别特征及字符串类型特征的机器学习框架。梯度提升是一种强大的机器学习技术,是解决具有异构特征、噪声数据和复杂依赖关系的问题的主要方法。本文以妊娠期糖尿病为研究对象,采用迭代自组织数据分析法(Iterative Selforganizing Data Analysis Techniques Algorithm,ISODATA)和拉伊达准则检测并且剔除离群值,将CatBoost作为预测模型,使用遗传算法(Genetic Algorithm,GA)优化对CatBoost模型的参数进行联合优化,选择最... 

【文章来源】:太原理工大学山西省 211工程院校

【文章页数】:74 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 概述
    1.2 课题研究的背景及意义
    1.3 国内外研究现状
        1.3.1 糖尿病预测模型研究现状
        1.3.2 集成学习算法在疾病预测方面的研究现状
    1.4 主要存在的问题
    1.5 论文主要内容及章节安排
    1.6 本章小结
第二章 相关理论概述
    2.1 妊娠期糖尿病预测诊断综述
    2.2 医疗数据离群点检测方法
        2.2.1 基于统计的离群点检测
        2.2.2 基于邻近度的离群点检测
        2.2.3 基于密度的离群点检测
        2.2.4 基于One-class SVM的离群点检测
        2.2.5 基于聚类的离群点检测
    2.3 妊娠期糖尿病预测模型
        2.3.1 支持向量机
        2.3.2 人工神经网络
        2.3.3 集成学习
    2.4 预测诊断模型评估方法
        2.4.1 交叉验证
        2.4.2 性能评价指标
    2.5 本章小结
第三章 妊娠期糖尿病预测诊断数据预处理
    3.1 实验数据介绍
    3.2 检测并剔除离群点
        3.2.1 迭代自组织数据分析法(ISODATA)
        3.2.2 ISODATA检测并剔除妊娠期糖尿病数据离群点
    3.3 离散化和特征分析
        3.3.1 数据离散化
        3.3.2 特征分析
    3.4 缺失值处理
    3.5 本章小结
第四章 基于遗传算法改进CatBoost算法
    4.1 遗传算法
    4.2 网格搜索
    4.3 基于遗传算法改进的CatBoost模型
        4.3.1 GA-CatBoost模型
        4.3.2 网格搜索和遗传算法结果对比
    4.4 本章小结
第五章 级联GA-CatBoost妊娠期糖尿病预测模型
    5.1 基于支持向量机的妊娠期糖尿病预测模型
    5.2 基于人工神经网络的妊娠期糖尿病预测模型
    5.3 基于GA-CatBoost妊娠期糖尿病预测模型
        5.3.1 级联GA-CatBoost模型
        5.3.2 妊娠期糖尿病预测诊断实验结果
    5.4 模型结果对比分析
    5.5 本章小结
第六章 总结与展望
    6.1 全文总结
    6.2 未来展望
参考文献
致谢
攻读学位期间发表的学术论文



本文编号:3021692

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/fuchankeerkelunwen/3021692.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b58ad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com