当前位置:主页 > 科技论文 > 数学论文 >

带缺失数据列联表与半参数非线性动态因子模型的统计推断

发布时间:2020-11-08 13:25
   随着现代科学技术的高速发展,出现了越来越多的各种分类数据,基于这类数据的统计推断是生物医学研究中的一个重要课题.其中存在一类特殊的带缺失数据的R×C列联表,特别是带缺失数据的2×2列联表引起了许多学者的关注.本文研究了这类数据的统计推断问题.半参数动态因子分析模型(NDFAMs)是一个使用十分广泛的统计模型.使用传统方法来对这种NDFAMs进行统计建模和统计推断是非常困难的,有时甚至也是不可能的.本文就NDFAMs的建模和贝叶斯推断也作了一些工作.全文主要内容如下: 1.系统研究了带缺失数据列联表的等价性问题.在一些应用中,缺失数据机制依赖于分组而与治疗结果无关.基于这类缺失机制,我们研究了带不完全配对数据优比的等价性问题,提出了似然比统计量,score统计量和两个Wald型统计量,设计了三种检验方法(包括渐近方法,渐近无条件方法和Bootstrap重抽样方法).模拟研究表明渐近方法对于小样本或离散型样本导致第Ⅰ类错误暴涨,而渐近无条件方法和Bootstrap重抽样方法产生的第Ⅰ类错误更接近预先给定的显著性水平.和渐近方法相比,基于score检验统计量的Bootstrap重抽样方法和渐近无条件方法常常拥有:(i)第Ⅰ类错误更靠近名义显著性水平,(ii)在控制第Ⅰ类错误的前提下,拥有更高的功效,(iii)计算简单.因此,我们推荐在实际应用中采用基于score检验统计量的渐近无条件检验方法. 2.基于贝叶斯统计推断思想,对第二章中的等价性评价问题在R×C情形下进行再研究.其解决方案是将它转换为一种分层模型,再利用Stan进行建模.通过Stan的抽样机,就可以得到参数估计(包括贝叶斯P值)和密度函数估计.这种方法的最大特点是对带不完全数据的列联表统计推断提供了一种通用性解决方案.基于Stan的列联表建模具有非常好的灵活性,只需要做很少的修改就可以适用于列联表的其他统计推断问题. 3.研究了基于固定特异性水平下敏感差的区间估计问题.针对这个问题,基于广义分位数统计量,Wilson score统计量,Agresti-Coull统计量以及Bootstrap重抽样,我们提出了相应的五种区间估计方法,并在模拟研究中分别计算了这些方法相应的覆盖概率,区间长度和左右误差率.结果表明基于Agresti-Coull统计量的混合方法,无论样本容量是小或中等程度,还是误用相应分布.其效果都好于其他现存方法.当然,如果指定的分布恰当,那么基于广义分位数统计量的方法还是令人满意的. 4.研究了一个半参数非线性动态因子分析模型(DFAMs)的贝叶斯统计推断.本章介绍了一种最新的建模设计语言RStan.借助于此工具,假定DFAM模型中的参数先验服从截断DP先验,给出了这种模型的RStan代码,并利用模拟样本数据进行了统计分析推断.模拟结果表明,这种方法无论是计算效率,还是推断精度都具有一定的优势;更为重要的是这种方法具有一般性,特别是针对分层模型的贝叶斯推断. 综上所述,在对带缺失机制的分类数据进行统计推断时,既采用了频率学派的统计思想,也考虑了带先验分布的贝叶斯推断;尽管不同的思想都还有各自的优缺点,但是从方法的简洁有效性,准确性,可移植性等来看,我们还是更推崇贝叶斯方法,特别是随着分类数据维数的增加,计算难度和耗时显著增加.将这些数据结构转化为一个分层模型,不仅能降低分析的难度,而且更容易利用开发软件来建模.基于RStan语言来对分层模型进行统计推断不仅方便有效,而且具有一般框架性.
【学位单位】:云南大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:O212.1
【文章目录】:
摘要
Abstract
目录
第一章 前言
    1.1 选题背景和研究意义
    1.2 国内外研究现状
    1.3 本文的主要工作及创新点
第二章 带缺失数据的2×2列联表等价性检验
    2.1 引言
    2.2 模型与最大似然估计
        2.2.1 模型
        2.2.2 最大似然估计的EM算法
    2.3 检验统计量与检验方法
        2.3.1 检验统计量
        2.3.2 检验方法
    2.4 模拟研究及实际例子
        2.4.1 模拟研究
        2.4.2 实际例子
    2.5 讨论
    2.6 附表与附图
第三章 带缺失数据列联表的BAYES统计推断
    3.1 引言
    3.2 模型和贝叶斯P值
    3.3 模型表述
    3.4 模拟研究
    3.5 实例
    3.6 讨论
    3.7 附表与附图
第四章 基于固定特异性水平下敏感差的区间估计
    4.1 引言
    4.2 敏感差的广义置信区间估计
    4.3 敏感差的混合及Bootstrap区间估计
        4.3.1 敏感差的混合区间估计
        4.3.2 敏感差的Bootstrap区间估计
    4.4 模拟研究
    4.5 实际例子
    4.6 讨论
    4.7 附表与附图
第五章 基于RStan方法的半参数动态因子分析模型的贝叶斯推断
    5.1 引言
    5.2 半参数动态因子分析模型
    5.3 基于Stan的模型描述
    5.4 样本数据生成
    5.5 基于Stan数据分析
    5.6 计算细节
    5.7 讨论
参考文献
发表文章目录
致谢

【共引文献】

相关期刊论文 前10条

1 李俭富;马永开;曾勇;;指数跟踪研究评述[J];当代经济管理;2005年06期

2 张利军;邸敬楼;赵岩;;基于MCMC的多维相关系数平稳序列[J];工程地球物理学报;2009年06期

3 陈汉鹏;戴金平;;Shibor作为中国基准利率的可行性研究[J];管理世界;2014年10期

4 刘睿智;周勇;;指数跟踪投资组合与多信息下指数可预测性——基于Adaptive LASSO和ARIMA-ANN方法[J];系统工程;2015年04期

5 徐凌;;现货组合跟踪指数过程的行业筛选应用研究[J];经济问题;2009年02期

6 夏潇阳;;基于现货卖出反向套利的指数复制模型[J];科学技术与工程;2008年20期

7 程海星;朱满洲;;中国货币政策冲击的测度与对经济波动的贡献[J];金融学季刊;2014年01期

8 周建;况明;;中国宏观经济动态传导、可靠性及货币政策机制[J];经济研究;2015年02期

9 汤丹;;中国核心通货膨胀的区域差异研究[J];经济问题探索;2015年05期

10 陈春锋,陈伟忠;指数优化复制的方法、模型与实证[J];数量经济技术经济研究;2004年12期


相关博士学位论文 前10条

1 温琪;金融市场资产选择与配置策略研究[D];中国科学技术大学;2011年

2 柴尚蕾;股指期货与现货市场的相关性及套期保值策略研究[D];大连理工大学;2011年

3 张明辉;指数化投资理论与实证分析[D];复旦大学;2003年

4 林飞;指数化投资理论、方法及实证研究[D];厦门大学;2003年

5 马骥;指数化投资[D];吉林大学;2004年

6 李俭富;基于我国证券市场的指数跟踪管理方法及应用研究[D];电子科技大学;2006年

7 王石;中国金融衍生品研究与中国期货市场实践[D];吉林大学;2006年

8 屈颖爽;基于跟踪误差的指数投资模型与业绩评价[D];吉林大学;2008年

9 张敏;股指期货套利与套期保值研究[D];华中科技大学;2007年

10 林祥友;融资融券交易下的股指期货市场功能研究[D];西南财经大学;2009年


相关硕士学位论文 前10条

1 徐杨;我国ETF与ETF联接基金的跟踪误差研究[D];西南财经大学;2011年

2 阮丽雅;基于EWMA模型的指数组合优化复制方法与实证研究[D];浙江大学;2007年

3 周婕;构建股指期货套利组合的研究[D];上海社会科学院;2008年

4 刘攀;若干指数复制方法及其实证研究[D];浙江大学;2008年

5 张海波;利用指数跟踪方法构建指数套利现货组合[D];厦门大学;2008年

6 李秋菊;有序属性响应半参数回归模型的贝叶斯分析[D];复旦大学;2009年

7 雍开伏;差分进化算法及其在指数复制中的应用[D];华中科技大学;2008年

8 葛新锋;有序数据的多元分析模型及实证研究[D];山西财经大学;2009年

9 胡玲娟;股指期货套保套利研究及实证分析[D];西南财经大学;2010年

10 翟园午;沪深300股指期货期现套利理论与实证研究[D];西北大学;2012年



本文编号:2874844

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2874844.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ee4c5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com