当前位置:主页 > 医学论文 > 心血管论文 >

心血管病流行病调查中缺失数据填补方法的比较及模拟研究

发布时间:2023-11-02 19:27
  目的 心血管疾病是世界范围内严重危害人类健康的疾病,近年来研究显示,其发病率和死亡率在发展中国家日益增高,针对这一类慢性疾病,很多大规模的流行病学调查研究开展起来,为心血管病的预防提供了新线索和大样本数据的证据。然而,由于人的社会属性和心理特点,常常导致一些科研资料存在不完整数据的情况,即存在缺失数据。对于缺失比例在一定范围内的数据,过去的做法多是直接删除,这种直接的做法虽然简单易行,但却会减少观测的样本量,从而影响分析结果的检验效能。近些年,插补类方法正得到越来越多专家和学者的认可,相应的新方法发展迅速。本研究利用单一插补和多重插补等方法处理缺失数据,重点对多重插补类方法之间的差别进行比较,期望寻找到适用于常规慢性流行病学调查研究中缺失数据的填补策略与方法。 方法 以心血管病领域的一个大样本、多变量数据集为基础,采用蒙特卡洛技术,按照完全随机缺失机制模拟该数据集在5%、10%、20%、30%四种缺失比例下,单个不同类型变量(包括连续变量、二值变量、有序变量和名义变量)的缺失情形,以及单调缺失模式两个变量缺失,或任意缺失模式两个变量缺失情形。每种缺失情形模拟500次。每次模拟中,分别采...

【文章页数】:185 页

【学位级别】:博士

【文章目录】:
表索引
图索引
中英文缩略词
中文摘要
Abstract
第一章 引论
    1.1 什么是缺失数据
    1.2 缺失数据的研究意义
    1.3 数据缺失的机制
    1.4 数据缺失的模式
    1.5 缺失数据的处理方法
    1.6 处理方法比较研究现状
    1.7 本研究内容
    1.8 研究方法
第二章 数据与方法
    2.1 数据来源
        2.1.1 定性变量的描述
        2.1.2 定量变量的描述
        2.1.3 SNP位点
    2.2 缺失值处理方法
        2.2.1 删除法
        2.2.2 单一插补-线性回归法
        2.2.3 多重插补
            2.2.3.1 多重插补-线性回归法
            2.2.3.2 多重插补-预测均值匹配法
            2.2.3.3 多重插补-趋势得分法
            2.2.3.4 多重插补-马尔科夫链蒙特卡洛法
            2.2.3.5 多重插补-logistic回归法
            2.2.3.6 多重插补-判别函数法
    2.3 缺失值模拟与处理方法
        2.3.1 连续变量处理效果的比较
        2.3.2 分类变量处理效果的比较
        2.3.3 不同填充策略和方法处理效果的综合评价
        2.3.4 处理策略和方法的具体实施
第三章 单变量缺失处理结果
    3.1 单个连续变量缺失处理结果
        3.1.1 缺失比例为5%
        3.1.2 缺失比例为10%
        3.1.3 缺失比例为20%
        3.1.4 缺失比例为30%
        3.1.5 插补效果综合比较
    3.2 单个二值变量缺失处理结果
        3.2.1 缺失比例为5%
        3.2.2 缺失比例为10%
        3.2.3 缺失比例为20%
        3.2.4 缺失比例为30%
        3.2.5 插补效果综合比较
    3.3 单个有序变量缺失处理结果
        3.3.1 缺失比例为5%
        3.3.2 缺失比例为10%
        3.3.3 缺失比例为20%
        3.3.4 缺失比例为30%
        3.3.5 插补效果综合比较
    3.4 单个名义变量缺失处理结果
        3.4.1 缺失比例为5%
        3.4.2 缺失比例为10%
        3.4.3 缺失比例为20%
        3.4.4 缺失比例为30%
        3.4.5 插补效果综合比较
第四章 多变量缺失处理结果
    4.1 单调缺失模式多变量缺失处理结果
        4.1.1 两连续变量缺失处理结果
            4.1.1.1 缺失比例为5%
            4.1.1.2 缺失比例为10%
            4.1.1.3 缺失比例为20%
            4.1.1.4 缺失比例为30%
            4.1.1.5 插补效果综合比较
        4.1.2 连续变量与二值变量缺失处理结果
            4.1.2.1 缺失比例为5%
            4.1.2.2 缺失比例为10%
            4.1.2.3 缺失比例为20%
            4.1.2.4 缺失比例为30%
            4.1.2.5 插补效果综合比较
        4.1.3 连续变量与有序变量缺失处理结果
            4.1.3.1 缺失比例为5%
            4.1.3.2 缺失比例为10%
            4.1.3.3 缺失比例为20%
            4.1.3.4 缺失比例为30%
            4.1.3.5 插补效果综合比较
        4.1.4 连续变量与名义变量缺失处理结果
            4.1.4.1 缺失比例为5%
            4.1.4.2 缺失比例为10%
            4.1.4.3 缺失比例为20%
            4.1.4.4 缺失比例为30%
            4.1.4.5 插补效果综合比较
    4.2 任意缺失模式多变量缺失处理结果
        4.2.1 两连续变量缺失处理结果
            4.2.1.1 缺失比例为5%
            4.2.1.2 缺失比例为10%
            4.2.1.3 缺失比例为20%
            4.2.1.4 缺失比例为30%
            4.2.1.5 插补效果综合比较
        4.2.2 连续变量与二值变量缺失处理结果
            4.2.2.1 缺失比例为5%
            4.2.2.2 缺失比例为10%
            4.2.2.3 缺失比例为20%
            4.2.2.4 缺失比例为30%
            4.2.2.5 插补效果综合比较
        4.2.3 连续变量与有序变量缺失处理结果
            4.2.3.1 缺失比例为5%
            4.2.3.2 缺失比例为10%
            4.2.3.3 缺失比例为20%
            4.2.3.4 缺失比例为30%
            4.2.3.5 插补效果综合比较
        4.2.4 连续变量与名义变量缺失处理结果
            4.2.4.1 缺失比例为5%
            4.2.4.2 缺失比例为10%
            4.2.4.3 缺失比例为20%
            4.2.4.4 缺失比例为30%
            4.2.4.5 插补效果综合比较
第五章 结论与讨论
    5.1 主要结论
        5.1.1 单变量缺失
        5.1.2 单调缺失模式多变量缺失
        5.1.3 任意缺失模式多变量缺失
    5.2 主要创新
        5.2.1 多重插补方法的全面比较
        5.2.2 不同插补方法处理效果的“统”、“分”评价
    5.3 本研究的不足之处
    5.4 相关展望
参考文献
文献综述
    参考文献
代表论著
个人简介
致谢



本文编号:3859615

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/xxg/3859615.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户032d9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com