广义函数型回归模型及缺失数据模型
本文关键词: 函数型数据分析 函数型主成分分析 广义函数型线性模型 缺失数据 随机缺失 多项式样条 渐近正态性 出处:《云南大学》2016年博士论文 论文类型:学位论文
【摘要】:随着数据收集工具和存储技术的进步,如何从海量的数据中挖掘出有价值的信息已成为各领域共同关注的问题。而作为一种能够处理高维复杂数据的统计方法-函数型数据分析方法,已成为近十多年来统计学领域研究的热点问题之一,并被广泛的应用到金融工程、生物化学工程、医学、水文、脑图像分析与建模等领域。缺失数据在实际中非常普遍,如在抽样调查中,被调查者不愿意回答某些问题,药物追踪试验中病人中途退出试验。在参数和半参数回归模型下,对缺失数据的处理与分析已被广泛研究,然而在函数型数据下,关于缺失数据问题的研究还非常少。另外,广义线性模型由于其能对各种不同的响应变量进行回归建模,因而自提出便被广泛研究。在函数型数据下,James (2002)首次将传统的广义线性模型推广到函数型数据,提出了广义函数型线性模型,并基于函数型主成分方法讨论了模型的统计推断问题,但用多项式样条方法来研究该模型的统计推断还比较少。为此,本文首先研究了广义函数型回归模型的多项式样条估计问题,其次讨论了响应变量随机缺失的函数型部分线性模型的统计推断问题,这些研究具有重要的理论意义和一定的实际应用价值。本文的主要研究工作包括:(1)在广义函数型线性模型下通过引入额外的协变量,提出了广义部分函数型线性模型,该模型是Zhang et al. (2007)和Shin (2009)的部分函数型线性模型的推广;构造了模型参数向量和斜率函数的多项式样条估计,并在一定条件下得到了参数估计的渐近正态性和斜率函数多项式样条估计的全局收敛速度。通过数值模拟说明了多项式样条方法的可行性。(2)在响应变量随机缺失的情况下研究了Lian(2011)提出的函数型部分线性模型的多项式样条估计,并对均值提出了基于回归插补和部分逆概率加权两种估计方法。在给定的条件下,得到了基于不完全数据模型斜率函数估计的收敛速度,以及两种均值估计的收敛速度。通过与Ferraty et al (2013)的结论相比较,发现在函数型部分线性模型下,均值的两种插补估计达不到(?)的相合速度,除非模型中的斜率函数限制在一个有限维的函数空间。通过数值模拟,研究了多项式样条估计的有限样本行为。(3)在响应变量随机缺失的情况下构建了函数型部分线性模型的函数型主成分估计。同样地,对均值提出了基于回归插补和部分逆概率加权两种估计方法。在给定的条件下,得到了基于不完全数据模型斜率函数估计的收敛速度,该结论与Lian(2011)的结论完全一样。对于两种均值估计,得到了类似的收敛速度,该结果表明:在本文给定的条件下达不到Ferraty et al (2013)中的(?)相合速度。最后,通过两个数值模拟说明了函数型主成分方法和多项式样条方法的可行性。
[Abstract]:Along with the data collection tool and the storage technology advancement. How to mine valuable information from the massive data has become a common concern in all fields. As a statistical method which can deal with high-dimensional and complex data, the functional data analysis method. It has become one of the hot issues in the field of statistics in recent ten years, and has been widely used in financial engineering, biochemistry engineering, medicine, hydrology. In the field of brain image analysis and modeling, missing data is very common in practice. For example, in the sample survey, the respondents are unwilling to answer some questions. Under parametric and semi-parametric regression models, the treatment and analysis of missing data have been extensively studied, however, in functional data. There are few researches on missing data problem. In addition, generalized linear model is widely studied under functional data because of its ability to model different response variables. James / 2002) extended the traditional generalized linear model to the functional data for the first time, proposed the generalized functional linear model, and discussed the statistical inference problem of the model based on the functional principal component method. However, the statistical inference of the model is less studied by polynomial spline method. In this paper, we first study the polynomial spline estimation of generalized functional regression model. Secondly, the problem of statistical inference for function-type partial linear model with random absence of response variables is discussed. These studies have important theoretical significance and practical application value. The main research work in this paper includes the introduction of additional covariables in the generalized functional linear model. In this paper, a generalized partial functional linear model is proposed, which is a generalization of the partial functional linear model of Zhang et al. 2007) and Shin et al. 2009). The polynomial spline estimation of the parameter vector and slope function of the model is constructed. Under certain conditions, the asymptotic normality of parameter estimation and the global convergence rate of slope function polynomial spline estimator are obtained. The feasibility of polynomial spline method is illustrated by numerical simulation. In the case of random absence of response variables, the polynomial spline estimation of functional partial linear model proposed by Lianqian 2011) is studied. Two estimation methods based on regression interpolation and partial inverse probability weighting are proposed for the mean value. The convergence rate of slope function estimation based on incomplete data model is obtained under given conditions. And the convergence rate of the two mean estimators. Compared with the conclusion of Ferraty et al. 2013), it is found that in the partial linear model of function type. The two interpolation estimates of the mean value can not reach? Unless the slope function in the model is confined to a finite dimensional functional space. In this paper, we study the behavior of finite sample of polynomial spline estimator. We construct the function-type principal component estimation of functional partial linear model under the condition of random absence of response variables. Two estimation methods based on regression interpolation and partial inverse probability weighting are proposed for the mean value. The convergence rate of slope function estimation based on incomplete data model is obtained under given conditions. This conclusion is exactly the same as that of Lianqian 2011). For the two mean estimators, a similar convergence rate is obtained. The results show that the Ferraty et al. 2013 can not be obtained under the given conditions in this paper. Finally, the feasibility of the functional principal component method and the polynomial spline method are demonstrated by two numerical simulations.
【学位授予单位】:云南大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:O212.1
【相似文献】
相关期刊论文 前10条
1 金勇进;缺失数据的加权调整(系列之Ⅳ)[J];数理统计与管理;2001年05期
2 赵慧秀;马文卿;;带有缺失数据的估计方程[J];曲阜师范大学学报(自然科学版);2009年03期
3 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期
4 杨金英;崔朝杰;;图模型方法用于二值变量相关性分析中缺失数据的估计[J];中国卫生统计;2012年05期
5 帅平;李晓松;周晓华;刘玉萍;;缺失数据统计处理方法的研究进展[J];中国卫生统计;2013年01期
6 金勇进;缺失数据的偏差校正(系列三)[J];数理统计与管理;2001年04期
7 毕华,李济洪;带有缺失数据的聚类分析方法[J];华北工学院学报;2003年05期
8 李开灿;;有缺失数据的META-MARKOV模型的局部计算[J];应用数学学报;2007年03期
9 周伟萍;张德然;杨兴琼;;具有部分缺失数据时两个几何总体的估计[J];长春大学学报;2008年02期
10 梁怡;;缺失数据的插补调整方法[J];西安文理学院学报(自然科学版);2009年01期
相关会议论文 前8条
1 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 陈楠;刘红云;;基于增长模型的缺失数据处理方法之比较[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
4 肖进;贺昌政;;面向缺失数据的客户价值区分集成模型研究[A];中国企业运筹学[2010(1)][C];2010年
5 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年
6 孙玲;刘浩;袁长亮;;北京市城市快速路微波检测缺失数据分析[A];2008第四届中国智能交通年会论文集[C];2008年
7 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年
8 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
相关博士学位论文 前10条
1 马友;基于QoS缺失数据预测的个性化Web服务推荐方法研究[D];北京邮电大学;2015年
2 彭清艳;广义函数型回归模型及缺失数据模型[D];云南大学;2016年
3 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年
4 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年
5 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年
6 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年
7 赵鹏飞;混沌数据恢复与非线性系统的模型参考控制[D];吉林大学;2010年
8 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年
9 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年
10 付志慧;多维项目反应模型的参数估计[D];吉林大学;2010年
相关硕士学位论文 前10条
1 杨利华;缺失数据的处理方法研究及应用[D];景德镇陶瓷学院;2011年
2 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年
3 褚培肖;缺失数据下的有限混合计数数据模型的统计推断研究[D];昆明理工大学;2015年
4 申宁宁;纵向研究缺失数据多重填补及混合效应模型分析[D];山西医科大学;2015年
5 李少琼;纵向研究二分类缺失数据处理及加权估计方程的应用[D];山西医科大学;2015年
6 高宇钊;比值缺失数据的多重估算与心脏康复二级预防干预效果评价及应用[D];山西医科大学;2015年
7 李顺静;基于EM算法的缺失数据的统计分析及应用[D];重庆工商大学;2015年
8 汪静波;Logistic回归模型中缺失数据的处理[D];南京大学;2015年
9 朱建斐;数据集缺失数据恢复算法研究[D];西安电子科技大学;2015年
10 杨旭;多视角数据缺失补全问题研究[D];北京交通大学;2016年
,本文编号:1463095
本文链接:https://www.wllwen.com/kejilunwen/yysx/1463095.html