当前位置:主页 > 社科论文 > 社会学论文 >

混合回归模型的变点检测

发布时间:2019-01-14 11:04
【摘要】:大数据时代的到来产生了丰富海量的数据,但如何有效地检测出数据中异常突变点备受人们关注.变点检测技术无疑是目前解决这一问题的最有效手段之一,该检测手段已广泛应用到经济学、气候模拟、生物医药、反恐安检等各个领域,具有重要的研究意义.但对带有时间序列自回归影响,又有协变量线性回归影响的数据模型,即本文提出的混合回归模型已有文献鲜有涉及.本文计划就混合回归模型中的变点检测问题进行研究.本文首先对一些经典文献做简要的回顾,并对简单的均值模型、自回归模型、回归模型进行了分析总结,构造出新的模型,即混合回归模型.然后,采用带有惩罚的最小二乘法对模型参数进行估计.考虑到变点的稀疏性,我们借助了Group Lasso(Least absolute shrinkage and selection operator)技术将变点估计问题转化变量选择问题,同时给出了寻找变点的坐标下降算法.接着,给出了混合回归模型变点检测的方法,即提出检测统计量,并在一定条件下给出相应的统计性质和理论证明.最后,利用数据模拟进一步分析说明.本文主要结论:在给定条件下,变点个数的估计不小于真实变点个数是依概率趋于1的;变点位置的估计与真实位置、模型参数的估计与真实参数都具有一致性(指在给定条件下,变点位置的估计与真实位置或者模型参数的估计与真实参数差的绝对值能被限定在某个范围内);若变点个数的估计不小于真实变点个数时,变点估计集与真实变点集具有一致性;在给定的信息准则下,仅与模型调节参数有关的变点数量的估计依概率1趋于真实变点数量.模拟结果显示,混合回归模型与已有三种模型相比,可以更加准确的检测出变点位置及数量,且稳定性高,优势明显.
[Abstract]:The arrival of big data era has produced a wealth of data, but how to effectively detect the abnormal mutation in the data has attracted people's attention. Change-point detection technology is undoubtedly one of the most effective methods to solve this problem. It has been widely used in economics, climate simulation, biomedicine, anti-terrorist security inspection and other fields, which has important research significance. However, the data model with time series autoregressive effect and covariable linear regression effect, that is, the mixed regression model proposed in this paper, has rarely been involved in the literature. This paper plans to study the problem of change point detection in mixed regression model. In this paper, some classical literatures are reviewed briefly, and the simple mean model, autoregressive model and regression model are analyzed and summarized, and a new model, that is, mixed regression model, is constructed. Then, the least square method with penalty is used to estimate the model parameters. Considering the sparsity of the change point, we transform the variable selection problem into the variable selection problem with the help of Group Lasso (Least absolute shrinkage and selection operator) technique. At the same time, we give a coordinate descent algorithm for finding the change point. Then, the method of change point detection in mixed regression model is given, that is, the detection statistics are proposed, and the corresponding statistical properties and theoretical proof are given under certain conditions. Finally, the data simulation is used to further analyze and explain. The main conclusions of this paper are as follows: under given conditions, the number of change points is estimated to be not less than the number of real change points. The estimation of the position of the change point is consistent with the real position, the estimation of the model parameter is consistent with the real parameter (that is, under given conditions, The absolute value of the difference between the estimation of the position of the change point and the real position or the estimation of the model parameters and the real parameter can be limited to a certain range. If the number of change points is not less than the number of real change points, the set of change point estimators is consistent with the set of real change points, and under the given information criterion, the estimation of the number of change points related only to the adjustment parameters of the model tends to the number of real change points according to probability 1. The simulation results show that the hybrid regression model can detect the position and number of change points more accurately than the existing three models, and the stability is high and the advantages are obvious.
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:C81

【相似文献】

相关期刊论文 前10条

1 陈希孺;变点统计分析简介[J];数理统计与管理;1991年01期

2 王黎明;变点统计分析问题及其应用[J];内蒙古统计;2004年03期

3 王黎明;;三种变点问题理论及其应用[J];泰山学院学报;2007年06期

4 王景乐;刘维奇;;时间序列中方差的结构变点的小波识别(英文)[J];应用概率统计;2010年02期

5 廖远u&;朱平芳;;均值和方差双重变点的贝叶斯侦测[J];统计研究;2011年11期

6 陈希孺;变点统计分析简介[J];数理统计与管理;1991年02期

7 陈希孺;变点统计分析简介(Ⅳ)局部比较法[J];数理统计与管理;1991年04期

8 王黎明;变点统计分析的研究进展[J];统计研究;2003年01期

9 邓薇;熊波;黄黎康;;位置参数变点的统计推断[J];统计与信息论坛;2010年07期

10 谭智平;只有一个变点模型的跳变度和坡变度的联合分布[J];衡阳师专学报(自然科学);1996年06期

相关会议论文 前3条

1 陈惠;汤银才;;已知变点数下二次回归模型方差变点分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年

2 汪永新;;短样本多指标动态经济数据变点的识别方法[A];中国现场统计研究会第九届学术年会论文集[C];1999年

3 李强;王黎明;王文雯;;基于中国股市行业收益率面板数据的贝叶斯方法变点检测[A];中国系统工程学会第十八届学术年会论文集——A13其他管理领域的创新研究成果问题[C];2014年

相关博士学位论文 前9条

1 张立文;分位数回归中变点问题的若干研究[D];复旦大学;2014年

2 王丹;重尾序列与非参数回归模型的变点分析[D];西北大学;2014年

3 李拂晓;几类时间序列模型变点监测与检验[D];西北工业大学;2015年

4 谭常春;变点问题的统计推断及其在金融中的应用[D];中国科学技术大学;2007年

5 韩四儿;两类厚尾相依序列的变点分析[D];西北工业大学;2007年

6 董翠玲;测量误差模型方差变点的统计推断[D];中国科学技术大学;2013年

7 聂维琳;变点靠近序列端点的检测问题[D];武汉大学;2010年

8 赵华玲;逐段线性回归中变点问题的统计推断[D];武汉大学;2011年

9 王景乐;非参数模型中变点的检测及删失数据中删失指标随机缺失下回归函数的估计[D];复旦大学;2012年

相关硕士学位论文 前10条

1 陈少梦;基于Cucconi检验及变点模型的非参数统计质量控制图研究[D];浙江大学;2015年

2 刘俐;基于变点—模糊理论的龙滩水库汛期分期调度研究[D];广西大学;2015年

3 刘晋芳;多元正态向量均值变点在线监测[D];山西大学;2015年

4 王新乔;半参数面板回归模型的变点分析[D];大连理工大学;2015年

5 樊庆祝;基于贝叶斯分析理论的快递业务量变点研究[D];广西师范学院;2015年

6 吕会琴;厚尾相依序列变点Ratio检验[D];西安工程大学;2016年

7 侯炳山;面板数据中均值与方差的断点分析[D];浙江大学;2016年

8 李明宇;面板数据AR(1)模型的变点分析[D];浙江大学;2016年

9 张瑞红;基于局部多项式回归的时间序列变点检测[D];南京大学;2016年

10 任好好;基于变点监测的VaR度量方法研究[D];山东大学;2016年



本文编号:2408629

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/2408629.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8a65a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com