敏感问题9种RRT模型下(分层)二阶段抽样调查设计的统计方法及其应用
本文关键词:敏感问题9种RRT模型下(分层)二阶段抽样调查设计的统计方法及其应用
更多相关文章: 敏感问题 随机应答技术(RRT) 艾滋病 (分层)二阶段抽样 样本大小
【摘要】:目的: 敏感问题由于具有高度私人机密性或不便在公开场合表态和陈述,若采用直接询问等传统的调查方式,会产生无应答偏倚或故意说谎偏倚。为了提高敏感问题的正确应答率,国内外统计学家研究开发出了一系列关于敏感问题调查的随机应答技术(Randomized Response Technique, RRT)模型。 目前,国内外研究较多的敏感问题类型为二项选择敏感问题和数量特征敏感问题,而对于多项选择敏感问题较少关注;研究较多的敏感问题抽样调查的统计方法主要局限于简单随机抽样,实际应用也主要局限于小范围特殊人群小样本的简单随机抽样调查,或在大规模调查中将复杂抽样调查方法获取的敏感问题资料误用简单随机抽样调查有关公式来统计分析;抽样调查是重要的研究方法,抽样设计是抽样调查的关键,样本大小的估计是抽样设计的重要环节。但关于敏感问题随机应答模型在各种复杂抽样方法下各阶段样本大小的估计,目前相关文献仍较少见。有鉴于此,本文拟对9种随机应答模型与二阶段抽样及分层二阶段抽样2种抽样方法组合的共18种调查方法,在给出敏感问题特征相关统计量计算公式的基础上,当限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例及总体均数时的最优样本大小计算公式,为适用于各类型敏感问题较大规模或大规模调查的复杂抽样方法提供了科学的样本大小估计公式;通过对北京市男同性恋人群敏感问题特征的初步调查分析,为掌握北京市性病、艾滋病的流行趋势提供了初步的数据,并估计出样本大小计算公式中的有关统计量的数值;针对本团队拟于2013年开展的国家自然科学基金项目《敏感问题高危人群基数调查估计的统计方法及其应用》(编号:81273188)研究中北京市男同性恋人群基数及敏感问题特征的二阶段与分层二阶段抽样调查,按本文所推导的计算公式估计出各层各阶段的样本大小,完成该国家自然科学基金项目研究中的调查设计;对科学估计艾滋病高危人群基数及敏感问题的特征提供统计方法,为有关部门制订性病、艾滋病预防控制规划、措施提供科学依据。 方法: 一、对二项选择敏感问题Warner随机应答模型、二项选择敏感问题Simmons随机应答模型、二项选择敏感问题双无关问题模型和二项选择敏感问题改进的随机应答模型,多项选择敏感问题单一样本随机应答模型、多项选择敏感问题随机间接应答模型以及数量特征敏感问题无关联问题模型、数量特征敏感问题加法模型、数量特征敏感问题乘法模型9种随机应答模型,与二阶段抽样、分层二阶段抽样2种抽样方法组合的共18种调查方法,根据Cochran的经典抽样理论、全概率公式、均数的基本性质、方差的基本性质等概率论与数理统计学理论方法,给出了敏感问题总体比例、总体均数的估计量及其估计方差的计算公式。 二、分别对以上18种调查方法,在限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,使用哥西不等式、求条件极小值点等高等代数与高等数学的方法,从数学上推导出估计敏感问题特征总体比例、总体均数时各阶段的最优样本大小计算公式。 三、设计RRT的随机化装置,制定敏感问题的调查问卷,采用二项选择敏感问题Simmons模型、多项选择敏感问题随机应答模型、数量特征敏感问题加法模型及二阶段抽样、分层二阶段抽样方法,于2010年8月至2010年10月对北京市男男性行为人群(men who have sex with men, MSM)进行初步调查;并按本文给出的统计公式,对调查资料作初步的统计分析并估计出样本大小计算公式中的有关统计量的数值。 四、根据本文推导的敏感问题复杂抽样方法下的样本大小计算公式和初步调查得到的有关统计量的数值,对二项选择敏感问题Simmons模型、多项选择敏感问题随机应答模型、数量特征敏感问题加法模型下共10个敏感问题的二阶段抽样与分层二阶段抽样,分别计算在限定抽样误差的值使调查费用达到最小时所需各阶段最优样本大小和限定调查费用的值使抽样误差达到最小时所需各阶段最优样本大小。 结果: 一、本文设计了9种随机应答模型与二阶段、分层二阶段2种抽样方法组合的18种调查方法,分别对18种调查方法,给出了敏感问题总体比例、总体均数的估计量及其估计方差计算公式。 二、本文分别对9种随机应答模型与2种复杂抽样方法组合的18种调查方法,当限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例、总体均数的各阶段最优样本大小计算公式。 三、本文对北京市男男性行为人群进行了敏感问题3种随机应答模型下二阶段抽样、分层二阶段抽样的初步调查。其中二阶段抽样得到如下主要初步调查结果:北京市MSM人群首次男男性行为的年龄均数为21.9岁、标准误为0.1792岁;男男性行为月人均不同性伴人数2.79人,标准误为0.0860人;月人均男男性行为次数为4.8次,标准误为0.1587次;最近一次肛交男男性行为安全套全程使用的比例为77.63%,标准误为1.82%;上月男男性行为中从不全程使用安全套、有时全程使用安全套、每次全程使用安全套、没有肛交的比例分别为6.07%、29.16%、55.60%、8.86%,其标准误分别为0.93%、1.30%、1.84%、1.10%;男男商业性性行为的次均费用200元、200-399元、400-599元、600元以上的比例分别为2.60%、3.18%、0.88%、5.99%,其标准误分别为0.57%、1.05%、0.35%、0.65%;最近一年HIV病毒检测结果为阳性、结果不确定、没有检查过的比例分别为4.89%、1.31%、4.22%,其标准误分别为1.05%、0.54%、1.26%;最近一年性病检测结果有性病、无性病、没有检查过的比例分别为14.58%、77.49%、7.38%,其标准误分别为1.70%、2.37%、1.45%;男男性行为的方式为肛交、口交的比例分别为69.23%、15.57%,其标准误分别为2.21%、1.79%;安全套使用有破损的比例为3.53%,其标准误为0.92%。 四、针对本团队拟于2013年开展的国家自然科学基金项目《敏感问题高危人群基数调查估计的统计方法及其应用》(编号:81273188)研究中北京市男同性恋人群基数及敏感问题特征的二阶段与分层二阶段抽样调查,根据本文给出的公式和调查结果,计算出各层各阶段样本大小的估计值。 1、二阶段抽样:第一阶段需抽取的区县数n1=13,第二阶段平均每个区县需抽取的男男性行为者人数n2=129(人)。 2、分层二阶段抽样:第一层(15-29岁层)需抽取的区县数n11,=8,平均每个区县需抽取的男男性行为者人数n21=121(人);第二层(30-49岁层)需抽取的区县数n12=8,平均每个区县需抽取的男男性行为者人数n22=113(人)。 结论: 一、本文对敏感问题9种随机应答模型与二阶段、分层二阶段2种抽样方法组合的共18种调查方法,给出了敏感问题特征总体比例、总体均数的估计量及其估计方差的统计公式,并将其中三种随机应答模型的二阶段与分层二阶段抽样调查方法成功应用于北京市男男性行为人群这一性病、艾滋病高危人群的敏感问题预调查,取得了良好的实际应用效果。说明本文提供的调查方法及其统计公式科学、可靠、有效,具有广泛的应用前景。 二、预调查结果提示北京市男男性行为人群存在无固定性伴、肛交为主要性行为方式、全程使用安全套比例低、男男商业性性行为比例高(分层二阶段抽样结果达到6.11%)、未进行HIV病毒与性病检测比例高、安全套破损比例高(分层二阶段抽样结果达到5.43%)等艾滋病、性病高危性行为,性病艾滋病的防控形势不容乐观,应引起政府、卫生部门的高度重视,寻找合理的应对措施。 三、本文对敏感问题9种随机应答模型与二阶段、分层二阶段2种抽样方法组合的共18种调查方法,在限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例、总体均数的各层各阶段最优样本大小计算公式,为敏感问题的抽样调查设计提供了科学的新方法。采用3种随机应答模型与二阶段、分层二阶段2种抽样方法组合的6种调查方法及本文推导的公式,对北京市男男性行为人群基数及敏感特征的调查估计了各层各阶段所需的最优样本大小,具有广泛的应用前景和推广意义。
【关键词】:敏感问题 随机应答技术(RRT) 艾滋病 (分层)二阶段抽样 样本大小
【学位授予单位】:苏州大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:R181.1
【目录】:
- 中文摘要4-8
- Abstract8-13
- 目录13-15
- 引言15-19
- 第一部分 敏感问题(分层)二阶段抽样调查设计的统计方法19-90
- 1. 二项选择敏感问题Warner模型的二阶段抽样19-22
- 2. 二项选择敏感问题Simmons模型的二阶段抽样22-25
- 3. 二项选择敏感问题双无关问题模型的二阶段抽样25-29
- 4. 二项选择敏感问题改进的随机应答模型的二阶段抽样29-32
- 5. 多项选择敏感问题单一样本随机应答模型的二阶段抽样32-35
- 6. 多项选择敏感问题随机间接应答模型的二阶段抽样35-38
- 7. 数量特征敏感问题无关联问题模型的二阶段抽样38-42
- 8. 数量特征敏感问题加法模型的二阶段抽样42-45
- 9. 数量特征敏感问题乘法模型的二阶段抽样45-48
- 10. 二项选择敏感问题Warner模型的分层两阶段抽样48-52
- 11. 二项选择敏感问题Simmons模型的分层两阶段抽样52-56
- 12. 二项选择敏感问题双无关问题模型的分层两阶段抽样56-62
- 13. 二项选择敏感问题改进随机应答模型的分层两阶段抽样62-66
- 14. 多项选择敏感问题单一样本随机应答模型分层二阶段抽样66-71
- 15. 多项选择敏感问题随机间接应答模型的分层二阶段抽样71-75
- 16. 数量特征敏感问题无关联问题模型的分层二阶段抽样75-80
- 17. 数量特征敏感问题加法模型分层二阶段抽样80-85
- 18. 数量特征敏感问题乘法模型分层二阶段抽样85-90
- 第二部分 北京市男男性行为人群的(分层)二阶段抽样调查90-144
- 1. 前言90-91
- 2. 调查设计91-93
- 3. 调查和结果分析93-144
- 第三部分 北京市男男性行为人群基数及性行为特征抽样调查样本大小的估计144-179
- 1. 二阶段随机抽样样本大小的计算144-158
- 2. 分层二阶段随机抽样样本大小的计算158-178
- 3. 最终样本大小的确定178-179
- 讨论179-183
- 总结与展望183-185
- 参考文献185-191
- 综述191-209
- 参考文献201-209
- 攻读博士学位期间主要科研成果209-210
- 附录210-213
- 致谢213
【参考文献】
中国期刊全文数据库 前10条
1 赵馨;闫在在;张景;魏福红;丁立刚;唐俊;;Warner模型中方差估计的随机组方法[J];内蒙古科技大学学报;2010年03期
2 杨海山;Simmons敏感性问题抽样调查误差的估算[J];中国煤炭经济学院学报;1996年02期
3 聂书云,王建宏;社会敏感问题统计调查方法研究[J];川北教育学院学报;2002年04期
4 章栋恩;随机化应答调查方案的参数估计问题[J];纯粹数学与应用数学;2000年02期
5 高歌;范玉波;王冕;;敏感问题随机应答技术模型分层整群抽样下参数的估计[J];第二军医大学学报;2009年02期
6 王丽艳;夏冬艳;吴玉华;张大鹏;王璐;吕繁;;乘数法估计北京、哈尔滨两市男性同性恋人群规模的研究[J];华南预防医学;2006年03期
7 蔡于茂;刘惠;潘鹏;洪福昌;冯铁建;;应用同伴推动抽样法对深圳地区男男性接触者AIDS相关知识和危险行为调查[J];华南预防医学;2009年01期
8 查干花;苗志峰;王丽艳;王璐;赵金扣;;同伴推动抽样法在西部某城市男男性接触者基数估计中的应用[J];华南预防医学;2009年06期
9 曾鸿;钟蕾;;论网络调查与传统调查方法的综合应用[J];工业技术经济;2006年12期
10 完颜华;闫在在;;Warner模型中的Jackknife方法[J];河南教育学院学报(自然科学版);2006年03期
,本文编号:673617
本文链接:https://www.wllwen.com/yixuelunwen/liuxingb/673617.html