医学与社会科学领域中基于研究设计的常用统计方法选择指南
发布时间:2020-12-09 03:26
科学研究是人类系统地、有条理地、有控制地获得知识和解决问题的一种实证方法。科学研究的特征就是使用一套科学的方法,科学研究的方法大致可分为两类,一类是定性研究法,另一类是定量研究法。本文专注定量研究法中的研究设计和统计分析方法两个重要环节。现有文献中描述统计方法的文章和专著很多,并且将研究设计与统计方法分开论述,鲜见专文描述在不同类型的研究设计框架下如何恰当地使用的具体的统计方法。这个问题在使用统计学作为最重要的控制各种混杂因素方法的医学与社会科学领域尤为突出。本文按不同的研究设计类型分别描述了相应的统计学方法的使用,统计方法包括基础统计模型到当代医学与社会科学领域常用的高级统计模型。本文意在为广大医学与社会科学研究者提供一项合理应用统计学方法的指南。
【文章来源】:医学与社会. 2020年01期 第1-7页 北大核心
【文章页数】:7 页
【部分图文】:
中介效应模型示意图
在医学与社会科学领域中,很多数据通过调查问卷的方式获取,除少数观测变量具有较高的信度外,观测变量常常出现准确性较差,测量误差较大,信度较低的问题,其后果是中介模型估计出X,M1,M2,Y之间的关系出现偏差,从而无法检验出X影响到Y的真实机制。在这种情况下,可以用潜变量代替显变量(即X,M1,M2,Y)并使用结构方程模型(structural equation modeling)来分析[7]。图3为结构方程模型示意图。椭圆形代表潜变量,长方形代表外显变量,箭头代表回归系数。潜变量是不可以直接观察到的变量,但它可以通过相应的可观测的外显变量推导出来。现实生活中有许多现象是不能直接观测到但可以通过其外在表现而间接观测的。例如一个人的爱好可能是无法直接观测的,但如果人们看到他经常去打球、跑步、健身、看体育比赛、追踪体育新闻等,人们依此可推断出他有体育爱好。另外很多疾病是无法直接观测到的,但可通过症状、体征、病理变化等诊断出疾病。潜变量与显变量之间的一项重要差别就是前者没有测量误差。故中介效应的估计更准确。如果研究目的不仅仅是反映观察期间内事件发生的概率,而是更关注何时事件会发生的概率或风险率则需要用到生存分析。例如癌症手术后五年内不同时间生存的概率和死亡的危险率及其影响因素,某疾病不同住院时间的概率及其影响因素等。Kaplan-Meier(K-M)生存概率估计法可用于估计在某一时间后的生存概率。Cox比例风险回归和Weibull回归最常用于此类问题分析。如果在观察期间同一事件多次发生且每次事件发生的具体时间可能不同,例如心脏病病人反复住院、戒烟多次失败、肿瘤多次复发等现象,如需对何时同一事件会反复出现的危险率及其影响因素进行研究,则使用分层Cox比例风险回归模型加上稳健方差估计(robust variance estimation)方法分析资料[8-9]。
随着近30年来统计学方法的迅猛发展,面对复杂繁多的统计方法,如何根据研究设计选择正确的统计方法,很多研究者感到缺乏足够的知识,需要清晰实用的方法指南;同时国内外的统计学专著往往将研究设计与统计分析方法分开论述[1],这样的安排有其原因和优势,但同时也使读者难以看清两者互相交织的关系。因此本文将结合每一种研究设计类型讨论统计分析方法的应用原则。1 实验性研究设计中统计方法的使用
本文编号:2906177
【文章来源】:医学与社会. 2020年01期 第1-7页 北大核心
【文章页数】:7 页
【部分图文】:
中介效应模型示意图
在医学与社会科学领域中,很多数据通过调查问卷的方式获取,除少数观测变量具有较高的信度外,观测变量常常出现准确性较差,测量误差较大,信度较低的问题,其后果是中介模型估计出X,M1,M2,Y之间的关系出现偏差,从而无法检验出X影响到Y的真实机制。在这种情况下,可以用潜变量代替显变量(即X,M1,M2,Y)并使用结构方程模型(structural equation modeling)来分析[7]。图3为结构方程模型示意图。椭圆形代表潜变量,长方形代表外显变量,箭头代表回归系数。潜变量是不可以直接观察到的变量,但它可以通过相应的可观测的外显变量推导出来。现实生活中有许多现象是不能直接观测到但可以通过其外在表现而间接观测的。例如一个人的爱好可能是无法直接观测的,但如果人们看到他经常去打球、跑步、健身、看体育比赛、追踪体育新闻等,人们依此可推断出他有体育爱好。另外很多疾病是无法直接观测到的,但可通过症状、体征、病理变化等诊断出疾病。潜变量与显变量之间的一项重要差别就是前者没有测量误差。故中介效应的估计更准确。如果研究目的不仅仅是反映观察期间内事件发生的概率,而是更关注何时事件会发生的概率或风险率则需要用到生存分析。例如癌症手术后五年内不同时间生存的概率和死亡的危险率及其影响因素,某疾病不同住院时间的概率及其影响因素等。Kaplan-Meier(K-M)生存概率估计法可用于估计在某一时间后的生存概率。Cox比例风险回归和Weibull回归最常用于此类问题分析。如果在观察期间同一事件多次发生且每次事件发生的具体时间可能不同,例如心脏病病人反复住院、戒烟多次失败、肿瘤多次复发等现象,如需对何时同一事件会反复出现的危险率及其影响因素进行研究,则使用分层Cox比例风险回归模型加上稳健方差估计(robust variance estimation)方法分析资料[8-9]。
随着近30年来统计学方法的迅猛发展,面对复杂繁多的统计方法,如何根据研究设计选择正确的统计方法,很多研究者感到缺乏足够的知识,需要清晰实用的方法指南;同时国内外的统计学专著往往将研究设计与统计分析方法分开论述[1],这样的安排有其原因和优势,但同时也使读者难以看清两者互相交织的关系。因此本文将结合每一种研究设计类型讨论统计分析方法的应用原则。1 实验性研究设计中统计方法的使用
本文编号:2906177
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2906177.html