一种新的单样本率的置信区间估计方法
发布时间:2020-05-23 23:32
【摘要】:背景:在医学研究领域,以二分类数据为结局的资料类型十分常见。对于此类数据的分析,应用中通常会给出效应量及效应量的置信区间,其中最常用的效应量包括:率、率差、率比、优势比等。单样本率的置信区间估计方法较多,以Wilson Score法的应用最为广泛,但均存在极端率情形下(接近0%或100%)置信区间覆盖率急剧下降的情况,即“downward spikes”现象。此外,不同方法还有着自身的局限,如Agresti-Coull提出的对于样本成功例数和失败例数分别加2的Agresti and Coull add 4 CI以及于样本成功例数和失败例数分别加z2的Agresti and Coull add z2 CI,Guan提出的广义Score法(Generalized Score CI),以及Yu提出的基于中点校正的Score法(Improved Score interval with a Modified Midpoint)等,虽然从不同的方面对Wilson Score CI有所改善,但是仍存在覆盖率不稳定、区间宽度过大等问题。在精确法中,Clopper-Pearson CI可以保证区间覆盖率不低于所设定的检验水准,但是该方法过于保守,Mid-P CI相对于Clopper-Pearson CI有所改善,但是结果仍较保守,而且精确法的计算量大,在应用上受到了一定的限制;Rubin和Schenke基于贝叶斯理论提出了Jeffrey CI,该方法能够解决在极端率的情况下区间覆盖率急剧下降的问题,但是其区间估计的结果过于保守,而且当事件发生率不接近0或者1时同样会出现“downwardspikes”现象。因此,目前并没有一种公认较好的单样本率的置信区间估计方法。两独立样本率差置信区间的构建相对于单样本率的情况更加复杂,虽然当前已有数十种方法被提出,但是这些方法自身均存在一定的不足。目前最常用的是Newcombe与1998年提出的Newcombe-Wilson Score CI,这种方法也受到了美国临床实验室标准化协会以及FDA指南的推荐。但是,当率接近0或100%的时候,Newcombe-Wilson Score CI较为保守。目的:本研究旨在基于Cornish-Fisher展开式结合Score法思想提出一种新的单样本率置信区间构建方法,并进一步将新方法推广到两独立样本率差置信区间的构建中,以期较现有方法的统计性能有明显改善。方法:(1)新方法的提出Comish-Fisher展开式是一种用于估计概率分布分位数的渐近展开方法,由Cornish和Fisher两位著名统计学家于1960年提出。其主要思想是通过概率分布的前n阶累积量和标准正态分布的分位数来近似估计概率分布的分位数。Wilson Score CI在极端率的条件下可能会出现覆盖率急剧下降的问题,其主要原因是当事件发生率接近0或1时,二项分布并非近似服从正态分布。因此,本研究考虑提出一种新的置信区间构建思想,在构建单样本率的置信区间时,舍弃传统的正态近似法,直接采用Cornish-Fisher展开式估计二项分布的分位数,希望以此避免近似正态分布时产生误差,提高结果的精确性。本研究将基于这种新思想构建的单样本率的置信区间命名为Cornish-Fisher CI。MOVER法(Method of Variance Estimate Recovery)是一种常用的率差/率比置信区间的构建策略,其主要思想是通过方差重估计(Variance Estimate Recovery)的方法将单样本率的置信区间“杂交”成两样本率差/率比的置信区间。我们将本研究提出的置信区间构建思想结合MOVER法构建出一种新的两独立样本率差的置信区间,并命名为Cornish-Fisher hybrid CI。(2)模拟研究在比较各种置信区间估计方法的优劣时,采用的评价指标包括置信区间的区间覆盖率、置信区间宽度、尾侧不覆盖率及其比值、最小区间覆盖率、均方误、平均置信区间宽度以及方法的计算复杂程度。对于单样本率的置信区间估计,本研究共纳入8种常见的方法包括:Wilson Score CI、Wald CI、Modified Midpoint CI、Generalized Score Cl、Agresti-Coull add z2 CI、Jeffrey CI、Mid-P CI、Randomized Plausible Interval,与新方法Cornish-Fisher CI进行模拟比较。对于两独立样本率差的置信区间估计,本研究重点考察当前使用最广泛的方法Newcombe-Wilson Score CI与新方法Cornish-Fisher hybrid CI 的优劣。结果:对于单样本率的置信区间估计,本研究提出的新方法在平均置信区间覆盖率、均方误及平均置信区间宽度等方面均表现最优,即在纳入比较的几种方法中,新方法在保证平均置信区间覆盖率的情况下,它的均方误及平均置信区间宽度是最小的。对于两独立样本率差的置信区间估计,当两事件发生率π1和π2接近0或1,即在(0,0.2](?)[0.8,1)范围内时,当前广泛推荐使用的Newcombe-Wilson Score CI存在过保守的问题,本研究新提出的Cornish-Fisherhybrid CI平均置信区间宽度小于Newcombe-Wilson Score CI,同时新方法的平均置信区间覆盖率更优,更接近置信水准1-α,故推荐使用新方法。结论:当事件发生率小于20%或大于80%时,本研究提出的置信区间估计新方法较常用的估计置信区间的Wilson Score CI方法有更优的统计性能。
【图文】:
逑2.4.3区间宽度的比较逡逑图2-5的横坐标表示新方法的置信区间宽度纵坐标表示原有方法的置信区逡逑间宽度,此图用于展示原有方法与新方法的区间宽度比值。若比值恰好与参照线逡逑(对角线的虚线)重合,则表示新方法与原有的方法区间宽度相等;若比值在参逡逑照线左上方,则表示原方法的区间宽度大于新方法,,即新方法更优;若比值在参逡逑照线的右下方,则表示原方法的区间宽度小于新方法,即原方法更优。逡逑从表2-4及图2-6可以看出,随着样本M增加,区间宽度足减小的趋势;而逡逑随着事件发生率接近0.5,E间宽度呈增大的趋势。逡逑由表2-4可知,在各种参数组合下,Wilson邋Score邋CI与Mdified邋Midpoint邋Score逡逑Cl的区间宽度均相等。当事件发生率小于0.2或大于0.8时
CW邋of邋our邋new邋method逡逑(Below邋the邋gray邋line邋means邋our邋new邋method邋better)逡逑图2-5新方法与原有方法的平均区间宽度比较逡逑Table邋2-5邋A邋com
【学位授予单位】:南方医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R195.1;O212.1
【图文】:
逑2.4.3区间宽度的比较逡逑图2-5的横坐标表示新方法的置信区间宽度纵坐标表示原有方法的置信区逡逑间宽度,此图用于展示原有方法与新方法的区间宽度比值。若比值恰好与参照线逡逑(对角线的虚线)重合,则表示新方法与原有的方法区间宽度相等;若比值在参逡逑照线左上方,则表示原方法的区间宽度大于新方法,,即新方法更优;若比值在参逡逑照线的右下方,则表示原方法的区间宽度小于新方法,即原方法更优。逡逑从表2-4及图2-6可以看出,随着样本M增加,区间宽度足减小的趋势;而逡逑随着事件发生率接近0.5,E间宽度呈增大的趋势。逡逑由表2-4可知,在各种参数组合下,Wilson邋Score邋CI与Mdified邋Midpoint邋Score逡逑Cl的区间宽度均相等。当事件发生率小于0.2或大于0.8时
CW邋of邋our邋new邋method逡逑(Below邋the邋gray邋line邋means邋our邋new邋method邋better)逡逑图2-5新方法与原有方法的平均区间宽度比较逡逑Table邋2-5邋A邋com
【学位授予单位】:南方医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R195.1;O212.1
【相似文献】
相关期刊论文 前10条
1 张彦;彭华;;基于变化稀疏表示的单样本人脸识别[J];信息工程大学学报;2017年02期
2 王梅花;班锦;;基于镜像奇异值分解的单样本人脸识别[J];微型机与应用;2010年16期
3 吴朋;周激流;李晓华;丁晓莲;;基于虚拟信息的单样本分块人脸识别[J];计算机工程与应用;2009年19期
4 张彦;彭华;;基于深度自编码器的单样本人脸识别[J];模式识别与人工智能;2017年04期
5 蔡s
本文编号:2678116
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2678116.html
最近更新
教材专著