【摘要】:研究背景:随机对照试验(Randomized Controlled Trial,RCT)被认为是证据等级最高的研究设计,是研究因果效应(Causal Effect)的金标准。但RCT研究并不能解决医学研究中的所有问题。由于观察性研究(observational study)不对研究对象进行随机分组,并且相对RCT更加节省费用和时间,因此越来越受到生物医学科研人员的关注。但观察性研究的研究对象基线变量在各个分组间存在着明显差异,存在混杂偏倚,从而影响处理效应估计(estimation of treatment effects)的准确性。倾向性评分法(Propensity Score,PS)是常见的可以用来控制可观测混杂的方法,其中,倾向性评分匹配法(Propensity Score Matching,PSM)应用最为广泛。PSM的基本思想是将PS相同或相近的处理组与对照组对象进行匹配,从而使得匹配后两组对象基线协变量均衡可比,控制混杂效应对处理效应估计的偏倚。为了控制匹配质量,只有处理组与对照组对象的PS距离小于设定好的一个值(卡钳值,caliper)时,才能形成匹配,该匹配方法称为倾向性评分卡钳匹配(Propensity Score Caliper Matching,PSCM)。此时由于部分处理组对象无法再对照组中找到PS距离小于卡钳值的对象从而排除匹配,因此会损失部分的样本。样本量损失的多少与卡钳值设置的大小有关。传统的PSM使用的是PS的点估计,未考虑抽样误差,损失了部分倾向性评分的信息。因此有学者提出使用倾向性评分的置信区间(confidence Interval,CI)进行匹配,称为倾向性评分区间匹配(Propensity Score Interval Matching,PSIM)。PSIM能使匹配率得到显著提升,尤其是在样本量较小的情况下。但可能导致匹配后组间协变量均衡性变差。基于运筹学整数规划问题中的指派问题(assignment problem)基本思想所构建的全局最优匹配(global optimal matching),着眼于使所有形成配对对象的倾向性评分距离之和达到最小或倾向性评分置信区间重合度之和达到最大,从而提高匹配质量,增加组间协变量的均衡性。因此,本研究将全局最优匹配算法用于优化PSIM,构建全局最优的倾向性评分区间匹配(Global Optimal Propensity Score Interval Matching,GOPSIM)算法,在增加匹配率的同时进一步平衡组间协变量,并将该算法扩展到处理因素为无序三分类的情形,以满足实际研究中的需要。研究目的:观察性研究中存在较强混杂效应或样本量较小的情形下,使用PSCM会损失较多样本。若不使用卡钳匹配,组间协变量的均衡性就可能较差。本研究针对这一系列问题,提出能提高匹配率、提升效应估计准确度以及增加统计效率的PSIM方法。并将能进一步优化匹配质量,提升匹配后基线均衡性的基于“指派问题”的全局最优算法应用于PSIM中。并将该匹配算法从处理因素为两分类扩展到无序三分类的情形。通过数据模拟研究,探索最优的PSIM的卡钳重合度,以及评价全局最优倾向性评分区间匹配的估计效应的准确性和精确性,从而构建最优的匹配算法。再将优化后的匹配算法应用于第五次全国卫生服务调查(上海地区)的实例研究中。研究方法:1.匹配算法构建本研究分别针对对两分类和无序三分类两种处理因素类别数,从优化性能(局部最优、全局最优)、匹配方法(点估计匹配、置信区间匹配)和卡钳设置情况(卡钳值、卡钳区间)等3个方面的不同水平组合进行匹配算法的构建,各构建2*2*2=8种匹配算法,共计16种。2.模拟数据集生成(1)两分类处理因素首先生成自变量,根据变量关系矩阵生成18个自变量,其中9个服从发生事件率为0.5的伯努利分布的两分类自变量X_1-X_9,以及9个服从均数为0,方差为1的正态分布连续性自变量X_1 _0-X_1 _8。使用logit函数和伯努利函数,并根据混杂效应的三种强度生成两分类处理变量,调整常数项使接受处理的对象比例控制在30%左右。最后,根据结局变量和处理变量与协变量的相关关系,使用logit函数和伯努利函数生成两分类结局变量,调整常数项使发生结局的比例控制在20%左右。两分类处理因素的模拟研究设置了3种样本量大小(200、500和1000)、3种混杂效应大小、6种处理效应大小共3*3*6=54种情形。每个情形生成1000个数据集,共产生了54,000个模拟数据集。(2)无序三分类处理因素自变量的生成跟处理因素为两分类一致。使用logit函数和多项分布函数,并根据混杂效应的三种强度生成三分类处理变量,调整常数项使三个处理水平发生的比例控制在2:3:5左右。最后根据处理变量、协变量和结局变量的关系,logit函数和伯努利函数生成两分类的结局变量,调整常数项使结局变量发生的比例控制在20%左右。无序三分类处理因素的模拟研究设置了2种样本量(500和1000)、3中混杂效应大小、两种处理效应大小,共2*3*2=12种情形。每种情形生成1000个数据集共12,000个模拟数据集。3.匹配算法的评价本研究根据以下7种评价指标来评价不同匹配算法的表现性能,包括:处理效应估计的绝对偏倚(absolute bias)、处理效应估计的相对偏倚(percent bias)、处理效应估计的方差(variance)、处理效应估计的均方误差(mean squared error)、处理效应估计的95%置信区间覆盖率(coverage of 95%CI)、匹配率和协变量组间标准化差异(standardized difference)。使用一般线性模型(general linear model,GLM)估计不同匹配方法7个评价指标的边际均数(marginal means),从而判断不同匹配方法的匹配性能的优劣。4.实例分析以上海区第五次国家卫生服务调查数据作为实例分析部分的资料来源。处理因素为二分类的实例为上海市郊区65岁以上独居老人与非独居老人的自评健康状况差异;处理因素为无序三分类的实例为上海市某区参保三种不同基本医疗保险的65岁以上老年女性居民的卫生服务利用情况比较分析。研究结果:1.模拟研究结果(1)倾向性评分区间匹配(1)处理因素为两分类两分类处理的局部最优匹配共四种,分别是两分类倾向性评分最邻近匹配(PSNNM2)、倾向性评分卡钳匹配(PSCM2)、倾向性评分最大区间重合度匹配(PSMIOM2)和倾向性评分区间匹配(PSIM2)。这4种匹配方法均能很大程度上降低处理效应的估计偏倚,并使得协变量在组间相对均衡。在未进行匹配时,处理效应估计的绝对偏倚和相对偏倚均很大。PSNNM2、最优卡钳值的PSCM2和PSMIOM2较其他方法绝对偏倚和相对偏倚均较大。其余匹配方法均能达到非常好的处理效应估计准确性。除了PSMIOM2外,其余匹配方法均能使协变量达到均衡状态。PSIM2绝对偏倚的绝对值在大多数的卡钳区间下均小于最优卡钳匹配,且有较高的匹配率。随着卡钳区间的减小,绝对偏倚也随之增加,当卡钳区间为0.60时绝对偏倚最接近0。此外,随着卡钳区间的增加,匹配率的逐渐下降。相反地,组间均衡性却增加。匹配率和协变量的组间均衡性互相矛盾,匹配率的增加会使协变量组间均衡性变差。(2)处理因素为无序三分类无序三分类处理的局部最优匹配共四种,分别是处理因素为无序三分类倾向性评分最邻近匹配(PSNNM3)、倾向性评分卡钳匹配(PSCM3)、倾向性评分最大区间重合度匹配(PSMIOM3)和倾向性评分区间匹配(PSIM3)。对于不同卡钳区间的PSIM3,随着卡钳区间的增加,协变量的平均标准化差异随之降低。相应地,匹配率也会随之下降。当实际数据的三个处理组的基线协变量差异较大时,模拟研究结果显示,卡钳区间设置为2.8时,可以更好地控制组间协变量的均衡性。反之,当基线协变量较均衡时,可以选取2.4作为卡钳区间来保证较高的匹配率,使得更多的对象可以形成匹配。(2)全局最优倾向性评分匹配(1)处理因素为两分类变量两分类的全局最优倾向性匹配共四种:两分类处理全局最优倾向性评分最邻近匹配(GOPSNNM2)、全局最优倾向性评分卡钳匹配(GOPSCM2)、全局最优倾向性评分最大区间重合度匹配(GOPSMIOM2)和全局最优倾向性评分区间匹配(GOPSIM2)。GOPSMIOM2的处理效应估计的绝对偏倚和相对偏倚均较大,但其处理效应估计的方差与其他匹配方法差不多。由于偏倚较大的原因,该匹配方法的均方误差较大、处理效应估计的95%置信区间覆盖率较低、协变量的组间均衡性较差。在各种卡钳区间重合度的GOPSIM2中,随之卡钳值的增加,处理效应估计的绝对偏倚也随之增加。匹配率和协变量平均标准化差异均随着卡钳区间重合度的增加而增加。当卡钳区间重合度为0.45时,匹配率较低,此时的平均标准化差异最小当卡钳区间重合度为0.90时,匹配率较高,此时的协变量平均标准化差异为5.02%,也远远小于10%的阈值。总的来看,所有匹配方法均能得到一个偏倚较小的处理效应估计。绝对偏倚最大的匹配方法是GOPSMIOM2,最小的是GOPSIM2-60。相对偏倚与绝对偏倚相类似。各个匹配方法的处理效应估计的方差均较小且很接近。基线协变量的平均标准化差异和匹配率呈正比关系。在没有进行卡钳区间筛选之前,协变量的平均标准化差异较大。通过卡钳区间的筛选,协变量的平均标准化差异显著下降。随着卡钳区间重合度的增加,平均标准化差异逐渐下降。匹配率也随之减小。总体来看,GOPSIM2-90的标准化差异较小,匹配率较高。(2)处理因素为无序三分类变量在GOPSCM3和GOPSNNM3中,不同匹配方法得到的处理效应估计的绝对偏倚和相对偏倚相对接近。绝对偏倚最大的匹配方法为卡钳值0.01的GOPSCM3。绝对偏倚最小的匹配方法是卡钳值0.02的GOPSCM3。处理效应估计的方差与偏倚的大致呈反比,偏倚越小方差越大。不同匹配方法间方差的差异不大。基线协变量的平均标准化差异和匹配率呈正比,匹配率越高,平均标准化差异也越大。GOPSNNM3的匹配率100.00%,随着卡钳值从0.5减小到0.01,匹配率从99.04%下降到56.47%,平均标准化差异从18.62%下降为6.44%。除了卡钳值为0.01的GOPSCM3,其余所有匹配方法协变量平均标准化差异小于10%,可认为协变量均衡可比。在GOPSMOIM3和GOPSIM3中,绝对偏倚最大的匹配方法是GOPSMIOM3(0.096),最小的是GOPSIM3-75(0.069)。相对偏倚与绝对偏倚相类似,也是GOPSMIOM最大(5.903%),GOPSIM3-75最小(4.384%)。各个匹配方法的处理效应估计的方差均较小,基本在0.075附近。由于GOPSMIOM3的处理效应的偏倚和方差均较大,因此其处理效应估计的均方误差也最大(5.094)。7种卡钳区间的GOPSIM3的均方误差较接近。基线协变量的平均标准化差异和匹配率呈正比关系。在没有进行卡钳区间筛选之前,协变量的平均标准化差异较大(16.14%),大于了10%的推荐阈值。通过卡钳区间的筛选,协变量的平均标准化差异显著下降。总体来看,GOPSIM3的标准化差异较小,匹配率较高。2.实例研究结果(1)上海市郊区65岁以上空巢老年居民自评健康状况研究排除了协变量或处理变量存在缺失的居民,最终477名独居老人和902名非独居老人纳入倾向性评分估计的模型。PSNNM2、PSMIOM2、GOPSNNM2和GOPSMIOM2的匹配率均为100%,GOPSCM2的匹配率最低,为38.99%,PSIM2匹配率最高45.49%。协变量平均标准化差异(Standardized Difference,SD)在匹配前为23.01%,四种没有设置卡钳值和卡钳区间,因此,这四种方法的协变量平均SD比较大,均大于10%。PSCM2的平均SD最小为5.28%。使用Wilcoxon秩和检验比较独居老人和非独居老人的自评健康状况,在匹配前,独居老人和非独居老人的自评健康差异有统计学意义,P0.0001。但在进行PSM后,8种匹配方法的结果均为独居老人和非独居老人的自评健康状况差异无统计学意义(P值均大于0.05)。区间匹配能比点估计的匹配增加一定的匹配率,例如把PSCM2的匹配率从41.51%提升到PSIM2的45.49%,把GOPSNNM2的38.99%提升到GOPSIM2的44.86%。但是,协变量的标准化差异变化不大,增加了不到2%。说明不论是否联合和全局最优匹配的算法,区间匹配能在几乎不影响协变量组间均衡性的情况下,一定程度的提升匹配率,尤其是在样本量比较小,或者两个处理组间协变量分布差异较大时,优势更加明显。(2)上海市某区老年女性居民医保类型对卫生服务利用的影响本实例研究对象纳入标准为上海市某区65岁以上老年女性居民,若其基本医疗保险参保情况缺失则排除本实例研究。通过整理数据,本实例共纳入了532名参保城镇职工基本医疗保险居民、343民城镇居民基本医疗保险参保居民以及235名新农村合作医疗系统参保居民,共1110人。PSNNM3、PSMIOM3、GOPSNNM3和GOPSMIOM3的匹配率为100%。但这四种匹配方法的协变量均衡性较差,均大于了10%,但显著地低于匹配前的27.88%。PSIM3的匹配率在其余的四种匹配方法中最高,达到了58.88%。GOPSCM3的匹配率最低,仅为42.26%。通过卡钳值或卡钳区间的控制,这四种匹配方法的协变量均衡性有了很大的提升,协变量平均SD均小于了10%。其中GOPSCM3的协变量均衡性最好,平均SD仅为6.42%。在匹配前,由于存在大量混杂偏倚,未能检验出三组间的两周就诊率的差异。但在经过PSM后,PSNNM3、PSIM3、GOPSNNM3和GOPSMIOM3卡方检验的P值均小于0.05,认为参保三种医保类型的居民两周就诊率差异有统计学意义。与模拟研究相类似,PSNNM3、PSMIOM3、GOPSNNM3和GOPSMIOM3四种匹配方法没有设置卡钳值或卡钳区间,匹配率为100%,但这四种方法的协变量均衡性就稍差一些。其余四种方法设置了卡钳值或卡钳区间,因此协变量均衡性有所提升。使用PSNNM3匹配有统计学意义,而设置了卡钳值后PSCM3就没有统计学意义了。这可能是由于设置了卡钳值后导致了样本量的损失,使得检验效率降低。但是,使用了区间匹配后,PSIM3的匹配率比PSCM3高出了一些,提升了部分的检验效率,因此又检验出了统计学差异。研究结论:卡钳区间为0.60的PSIM2在探索的16种卡钳区间的PSIM2中有着最优的表现。因此,通过本研究的模拟实验,推荐在进行PSM时,尤其是样本量比较小的时候,使用卡钳区间为0.60的PSIM2能得到较好的匹配。随着卡钳值的减小或卡钳区间重合度的增加,PSCM3或PSIM3的组间协变量均衡性会变的更均衡,但是匹配率会随之下降。通过权衡两者,并且结合处理效应估计的指标,本研究推荐使用卡钳区间为2.6的PSIM3进行处理效应为无序三分类的PSM。通过实例研究,进一步验证了匹配算法有着较好的表现性能。经过8种两分类倾向性评分匹配分析,上海郊区65岁以上独居与非独居老年女性居民的自评见状况差异均无统计学意义,敏感性分析的结果也显示差异无统计学意义。使用8种无序三分类倾向性评分匹配分析上海市某区65岁以上老年女性居民医保类型对两周就诊率是否存在差异。经过PSNNM3、PSIM3、GOPSNNM3和GOPSMIOM3后,假设检验P值小于0.05,说明参保三种基本医疗保险的居民的两周就诊率差异有统计学意义。敏感性分析结果也得到类似的结果。
【图文】: -22-图 1 本研究构建的匹配算法关系图(二)模拟数据集的产生本研究使用蒙特卡罗(Monte Carlo)数据模拟技术,模拟产生研究所需的数据集。模拟研究(simulation study)指的是用计算机强大的处理能力来评估各种统计方法的表现性能的研究方法[24]。贴合实际研究数据的复杂程度,首先随机产生 18 个协变量,其中 9 个为两分类变量,9 个为连续型变量。再根据这 18 个协变量与处理变量的关联程度产生处理变量。本研究考虑了处理变量为两分类和无序三分类两种情形。最后根据协变量、处理变量与结局变量的关联程度产生两分类的结局变量。模拟数据集具
(三)匹配算法的评价在本研究中采用处理效应估计的绝对偏倚、处理效应估计的相对偏倚、处理效应估计的方差、处理效应估计的均方误差、处理效应估计的 95%置信区间覆盖率、匹配率和匹配后样本的基线协变量的均衡性这 7 种评价指标来评价各种匹配算法在各种数据情形下的表现性能。(四)实例应用所构建的匹配算法应用于第五次国家卫生服务调查数据(上海市)。探索上海郊区65岁以上独居与非独居老人(两分类)的自评健康水平是否存在统计学差异,,以及三种不同医保类型(三分类)的居民对于卫生服务利用(两周门诊就诊率)是否存在统计学差异。以期用真实的案例研究来评价和比较本研究所探索的各种倾向性评分匹配的表现性能以及适用情形。二、技术路线
【学位授予单位】:中国人民解放军海军军医大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:O221.4;R195.1
【相似文献】
相关期刊论文 前10条
1 曲明;全局最优的法式分段线性建模[J];电子学报;1989年03期
2 叶小勇;雷勇;侯海军;;蚁群算法在全局最优路径寻优中的应用[J];系统仿真学报;2007年24期
3 常扣扣;火久元;梅凯;;一种带搜索因子的全局最优人工蜂群算法[J];重庆理工大学学报(自然科学);2017年06期
4 李欢;柳丽娜;;一类特殊六次规划问题的全局最优充分条件[J];湖北民族学院学报(自然科学版);2018年04期
5 何墉;李春娟;孙广东;;Buck变换器的全局最优滑模控制器设计[J];洛阳理工学院学报(自然科学版);2010年03期
6 陈农;非线性最优解在气动参数辨识中的应用[J];飞行力学;2002年01期
7 陈金辉;韩媛媛;张国瑞;董杰;;一种基于全局最优MPPT的混合控制策略研究[J];电力电子技术;2017年11期
8 黄敏;江渝;毛安;姜琪;;基于全局最优位置自适应选取与局部搜索的多目标粒子群优化算法[J];计算机应用;2014年04期
9 陈东彦;余永龙;胡军;;具有相关噪声和不确定观测系统的全局最优Kalman滤波[J];哈尔滨理工大学学报;2015年04期
10 李连锋,王广雄,姚远;全局最优鲁棒控制器设计[J];控制理论与应用;2001年02期
相关会议论文 前6条
1 徐滇生;毛绪瑾;;遗传算法在自控领域的应用初探[A];1992年控制理论及其应用年会论文集(下)[C];1992年
2 刘志宏;胡永明;施工;;特征统计算法及其在多极值优化问题上的应用[A];全国计算物理学会第六届年会和学术交流会论文摘要集[C];2007年
3 张德欣;周含冰;杨佳;陈元友;;约束条件下电子装备多目标分配的蚁群优化[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
4 焦寨军;沈兵;李红江;;几种遗传算法在舰船电力系统网络重构中应用及比较[A];现代船舶机电维修技术(2005)[C];2005年
5 陈俊风;任子武;范新南;;一种基于改进单纯形法和粒子群算法的混合优化算法[A];第25届中国控制会议论文集(中册)[C];2006年
6 罗文彩;陈小前;王振国;;多方法协作优化方法研究[A];2008’“先进集成技术”院士论坛暨第二届仪表、自动化与先进集成技术大会论文集[C];2008年
相关博士学位论文 前4条
1 郭轶斌;分类资料全局最优倾向性评分区间匹配的研究与应用[D];中国人民解放军海军军医大学;2019年
2 田君杨;基于矩量理论的电力系统全局优化算法研究[D];广西大学;2014年
3 周自维;基于立体视觉的环境构建及机器人路径规划研究[D];哈尔滨工业大学;2014年
4 郑建冬;基于单数码相机的三维摄影测量理论与关键技术研究[D];南京航空航天大学;2013年
相关硕士学位论文 前10条
1 游琛;改进的非概率全局最优解法及其在梁桥可靠度评估中的应用[D];武汉工程大学;2017年
2 唐成;运输优化问题中常见启发式算法比较与研究[D];西南交通大学;2014年
3 田东平;一种结合混沌搜索的自适应遗传算法[D];上海师范大学;2007年
4 钟珍;关于图像和视频彩色化算法的研究与实现[D];上海交通大学;2011年
5 管婷婷;多目标粒子群算法在物流配送中的应用研究[D];南昌大学;2012年
6 王霄;基于多智能体进化算法的聚类及其在图像分割中的应用[D];西安电子科技大学;2014年
7 庞峰;模拟退火算法的原理及算法在优化问题上的应用[D];吉林大学;2006年
8 高博;基于精英策略的混合粒子蚁群算法改进[D];燕山大学;2011年
9 赵礼阳;求解几类二层规划最优解的相关算法研究[D];重庆师范大学;2016年
10 汤继涛;全局智能优化算法的研究[D];江南大学;2014年
本文编号:
2695234