当前位置:主页 > 管理论文 > 统计学论文 >

复杂数据多变点分析的若干问题研究

发布时间:2020-09-08 08:48
   变点模型在地震学,金融学和遗传学等领域中有着广泛应用,且常常用于检测观测序列中的同质性.同质性意味着回归系数具有未知的分组,并且在每组中有完全相同的值.现代统计应用所面对的数据越来越复杂,维数也越来越大.检测这种高维序列的同质性是一个具有挑战性且重要的问题,特别的,与单个变点的检测相比,多变点检测问题更加困难.在本文中,我们将讨论复杂数据多变点检测的若干问题,重点讨论了不同模型设置下回归系数的同质性检测.通过结合高维模型选择的方法,我们提出了一种有效的多变点检测方法,并且讨论了基于该方法的同质性检测的准确性和统计性质.首先,本文考虑了一类高维线性模型,包括平衡面板数据动态线性模型和时空线性模型.通过构造自适应分组Lasso惩罚,我们给出了同时检测多个变点的方法.在一定条件下,即使真正的变点数目随着样本大小(即观测时间长度)而增大,我们也可以保证多变点估计的相合性.惩罚函数的选取有多种,其中包括分组Lasso和其他非凸组惩罚函数,包括分组SCAD和分组MCP等.模拟研究表明提出的算法快速且准确,且对不同类型的实际数据分析也表明了该方法的广泛适用性.其次,基于高维惩罚方法的变点检测,其检测的准确性依赖于惩罚函数中调节参数的选择,因为在计算过程中只有某一区间上的调节参数值对应了变点选择的相合性估计,即具有oracle性质的估计.因此,我们给出一个信息准则来研究自适应分组Lasso惩罚中的调节参数选择.同时,我们将扩展的正则化信息准则(ERIC)的结果推广到非凸的惩罚函数的分组选择方法中,且研究了每组中变量的个数发散情况下的选择相合性.此外,当变量中组的个数大于样本量时,我们还验证了 ERIC准则能够一致地识别真实的模型,从而得到具有oracle性质的估计.模拟结果和实际数据分析表明,ERIC准则的效果明显优于BIC和交叉验证方法.最后,除回归系数随时间变化的假设外,我们探讨了包含一般的先验约束信息的回归系数的同质性检测.我们提出了一种成对融合方法来处理系数包含先验凸约束信息的稀疏性和同质性检测.通过一种基于交替方向乘子法的算法来估计系数,并证明了该算法的收敛性.模拟结果和实际数据分析表明我们提出的算法是有效的.
【学位单位】:中国科学技术大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:C81
【部分图文】:

模型,变点,表示模型,标准误差


模型I逦模型II逦模型III逡逑/?!逦0.018(0.0089)逦0.025邋(0.0113)邋0.048邋(0.0164)逡逑02邋0.023邋(0.0113)邋0.030(0.0118)邋0.031邋(0.0084)逡逑0.019(0.0097)邋0.026(0.0112)邋0.016(0.0055)逡逑04邋0.018(0.0081)邋0.025(0.0103)邋0.031邋(0.0085)逡逑/?5邋0.021邋(0.0113)邋0.032(0.0138)邋0.049(0.0146)逡逑4邋0.013邋(0.0059)邋0.016邋(0.0075)邋0.041邋(0.0124)逡逑注:括号中的数值为500次模拟对应的标准误差.逡逑The邋GDP邋growth邋rate邋data逡逑

变点,表示模型,序列图,虚线


下三角矩阵,且:T是对角矩阵.逡逑在2008-2016年期间,共有4686笔交易,交易频率高且随时间变化很大.逡逑数据显示如图2.3.从图中很容易看到,一个假设未知但固定的丨,(^,(^^)逡逑的SLHP模型不太可能适合于该数据的.因此,我们考虑使用具有多个变点的逡逑SLHP模型对数据进行建模.为了构建模型,我们按照文献Li邋(2010)中的设逡逑置取^邋=邋30和&邋=邋3,因此时间窗宽设为TQ邋=邋90.实际上,我们可以选取逡逑rQ邋=邋60,90,120,180,邋BP,时间窗口设置为两个月、三个月、四个月或六个月,但逡逑这对数据的建模没有影响.我们根据(2.12)式构造空间矩阵兄我们取第〖个逡逑对角线元素7;.,.邋=逦来构造时间矩阵广我们将2008-2016分为两部逡逑分:2008-2015和2016.我们利用2008-2015年的所有观测数据(训练集)进行数逡逑据建模,并利用2016年的所有数据(测试集)计算预测误差.将AgLD方法应用逡逑到训练集后,我们发现2009年,2011年和2012年的三个变点,并分别以虚线形逡逑式显示在图2.3中.对于第一个变点的可能解释可能包括

准则,自适应


adgLasso-ERIC075逦0.2662逦0.1097(0.0251)逦4.070逦0.938逦0.0001逦0.0144adgLasso-ERICj逦0.2326逦0.1234(0.0266)逦4.048逦0.948逦0逦0.0108adgLasso-BIC#逦0.2481逦0.1101(0.0241)逦4.062逦0.944逦0逦0.0124adgLasso-BIC逦0.2507逦0.1112(0.0273)逦4.176逦0.874逦0逦0.0272adgLasso-CV逦0.2328逦0.1365(0.0385)逦6.514逦0.282逦0逦0.5028gSCAD-ERIC075逦0.2194逦0.1081(0.0219)逦4.102逦0.910逦0逦0.0204gSC邋AD-ERIC,逦0.2403逦0.1088(0.0254)逦4.042逦0.957逦0逦0.0085gSCAD-BICgc逦0.2213逦0.1111(0.0240)逦4.054逦0.954逦0逦0.0108gSCAD-BIC逦0.2397逦0.1096(0.0252)逦4.112逦0.918逦0逦0.0224gSCAD-CV逦0.2314逦0.1083(0.0233)逦6.010逦0.332逦0逦0.4020gMCP-ERIC075逦0.2187逦0.1078(0.0211)逦4.024逦0.984逦0逦0.0048gMCP-ERICj逦0.2173逦0.1015(0.0202)逦4.004逦0.996逦0逦0.0008gMCP-BICgc逦0.2182逦0.1026(0.0208)逦4.006逦0.994逦0逦0.0012gMCP-BIC逦0.250

【相似文献】

相关期刊论文 前10条

1 刘琮敏;张硕;李琦;王德辉;;具有变点理赔过程的风险模型[J];吉林大学学报(理学版);2017年03期

2 王慧敏;贺兴时;赵文芝;;相依序列均值和方差变点的估计[J];纺织高校基础科学学报;2017年02期

3 骆桦;刘兴;;基于一元方差分析的正态分布均值变点检测研究[J];工业控制计算机;2017年10期

4 朱志明;;变化笔画[J];七彩语文(写字与书法);2017年03期

5 朱志明;;简化笔画[J];七彩语文(写字与书法);2017年09期

6 王晓原;张敬磊;马立云;;基于加速遗传的交通流变点分析方法[J];统计与决策;2013年07期

7 张学新;;变点检测问题最新进展综述[J];江汉大学学报(自然科学版);2012年02期

8 徐海燕;惠军;胡宏伟;;带有结构变点的长记忆模型的实证研究[J];安庆师范学院学报(自然科学版);2011年01期

9 窦银科;常晓敏;董西路;;冰层厚度变点判别方法的探讨[J];太原理工大学学报;2009年01期

10 陈春梅;;二维射影变换中不变直线上至少有一不变点的另证[J];宜宾学院学报;2009年12期

相关会议论文 前5条

1 汪永新;;短样本多指标动态经济数据变点的识别方法[A];中国现场统计研究会第九届学术年会论文集[C];1999年

2 李强;王黎明;王文雯;;基于中国股市行业收益率面板数据的贝叶斯方法变点检测[A];中国系统工程学会第十八届学术年会论文集——A13其他管理领域的创新研究成果问题[C];2014年

3 张开鹏;吴代华;李卓球;;基于均值变点检验的结构损伤定位方法研究[A];第十三届全国结构工程学术会议论文集(第Ⅰ册)[C];2004年

4 贾磊;徐波;;基于检测熵变化趋势的音频特征跳变点检测[A];第六届全国人机语音通讯学术会议论文集[C];2001年

5 张玉珍;张小月;杨举;;基于信息方法的青海省各地区气温及降水数据变点分析与建模[A];2015年(第四届)全国大学生统计建模大赛论文[C];2015年

相关重要报纸文章 前10条

1 李龙;招聘变点招 公众难谅解[N];广州日报;2010年

2 记者 李楠;瓦轴营销变点为面[N];大连日报;2006年

3 省科顾委宏观经济专家组组长 陈永昌;我国宏观调控政策的四个新变点[N];黑龙江经济报;2008年

4 本报记者 邹平;四大园林景点整合资源“变点为片”[N];扬州日报;2007年

5 朱海;为春运之变点赞[N];云南日报;2015年

6 余刚;打好生财擦边球[N];经理日报;2007年

7 高天;创业也要别出心裁[N];就业时报;2007年

8 李玉萍;安全生产严抓四个“点”[N];中国矿业报;2008年

9 驻京记者 王丹;新修《专利法》涉药三大变点[N];医药经济报;2007年

10 本报记者 何芬 实习生 田春燕;实心实意为民办实事[N];衡阳日报;2009年

相关博士学位论文 前10条

1 李亚光;复杂数据多变点分析的若干问题研究[D];中国科学技术大学;2018年

2 谭常春;变点问题的统计推断及其在金融中的应用[D];中国科学技术大学;2007年

3 韩四儿;两类厚尾相依序列的变点分析[D];西北工业大学;2007年

4 李拂晓;几类时间序列模型变点监测与检验[D];西北工业大学;2015年

5 董翠玲;测量误差模型方差变点的统计推断[D];中国科学技术大学;2013年

6 谢焕田;时间序列非平稳性分析若干问题研究[D];武汉大学;2014年

7 聂维琳;变点靠近序列端点的检测问题[D];武汉大学;2010年

8 王丹;重尾序列与非参数回归模型的变点分析[D];西北大学;2014年

9 赵华玲;逐段线性回归中变点问题的统计推断[D];武汉大学;2011年

10 张立文;分位数回归中变点问题的若干研究[D];复旦大学;2014年

相关硕士学位论文 前10条

1 卢振法;基于自适应LASSO的均值变点检测[D];广西师范大学;2018年

2 李静;更新几何过程参数的统计推断及其应用研究[D];长沙理工大学;2017年

3 李艳鹏;基于二元分割的多变点检测及其在金融中的应用[D];哈尔滨工业大学;2018年

4 卢光贝;时间序列变点的统计推断[D];吉林大学;2018年

5 孙伟娜;基于RRINARCH模型的变点预测[D];吉林大学;2018年

6 李渊园;长记忆序列均值变点及单位根检验的研究[D];西安科技大学;2018年

7 孙嘉伟;基于类方差比的持久性变点检验及其应用[D];西安科技大学;2018年

8 范梓淼;泊松过程参数变点的统计推断[D];新疆师范大学;2017年

9 李志强;航空器轨迹变点检测与判识技术研究[D];中国民航大学;2017年

10 李忱颖;非线性时间序列模型变点检测[D];南京大学;2017年



本文编号:2813965

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2813965.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3ddb4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com