当前位置:主页 > 科技论文 > 数学论文 >

若干模型的分位数变量选择

发布时间:2017-10-20 13:35

  本文关键词:若干模型的分位数变量选择


  更多相关文章: 分位数回归 变量选择 计数数据 自适应LASSO PNSIM


【摘要】:分位数回归和变量选择方法LASSO提出以来,由于其稳定的估计,优良的估计效率得到了广泛应用.分位数回归能够从不同角度分析数据,变量选择的提出使模型具有了处理高维数据的能力.本文主要研究在复杂情况下的分位数回归变量选择,即医疗费用数据和离散数据.由于个体观察的相关性以及分布不连续导致针对以上两种数据进行分位数回归以及变量选择相对困难.本文根据学者在该领域的相关研究,提出了针对以上两种特殊数据进行分位数回归以及变量选择的方法,并验证其有效性.对于医疗费用数据,采用部分非线性单指标模型(PNSIM)进行建模,并采用两步法进行系数估计和变量选择.第一步采用基于样条的两步估计方法对模型的非参数部分进行估计,当非参数可加部分为阶可导时,使用样条方法得到的估计量以的速度收敛.并且该方法能够解决维数祸根问题.第二步在求得非参数部分的估计后,再进行系数估计以及变量选择.部分非线性单指标模型具有良好的灵活性,具有以往提出模型的大部分优点.对于离散数据,通过构造连续随机变量,使其分位数与响应变量分位数一一对应,进而能够使用传统分位数方法进行处理,并在此基础上进行变量选择.本文按照如下结构展开.第一章为文献综述,介绍近年来该领域的发展以及相关学者的研究.并且介绍本文的研究内容和创新之处.第二章的重点在于使用部分非线性单指标模型对医疗费用数据进行建模,运用基于样条的估计方法对可加模型的非参数部分进行估计,并且在此基础上进行系数的估计以及变量选择,本文在这里采用自适应LASSO惩罚项进行变量选择.章节最后给出相应的迭代方法,模拟,实例分析以及相关渐近性质的证明.第三章的重点在于对离散数据进行分位数回归变量选择.通过对响应变量进行恰当的处理,使传统分位数回归方法能够应用到离散数据.在此基础上再进行变量选择.本章最后给出相应的模拟,以验证提出方法的有效性.迭代算法和相关渐近性质的证明亦在文中给出.第四章给出本文总结,以及未来可能的研究方向.综上,本文主要介绍对医疗费用数据用部分非线性单指标模型(PNSIM)进行建模.对于离散数据,将其进行转换处理后再进行自适应LASSO变量选择.文中给出的估计量均具有良好的性质,并且避免了维数祸根的问题,对于处理高维解释变量具有一定的优越性.从计算效率来看,第二章中的非参数部分的估计最终转化为对相关线性模型的求解,避免了多次迭代,极大的提高了运算速度.
【关键词】:分位数回归 变量选择 计数数据 自适应LASSO PNSIM
【学位授予单位】:浙江财经大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O212.1
【目录】:
  • 摘要5-7
  • abstract7-10
  • 第一章 绪论10-14
  • 第一节 研究背景及意义10-11
  • 第二节 文献综述11-13
  • 第三节 论文简介及创新之处13-14
  • 第二章 部分非线性单指标模型的分位数回归及其变量选择14-35
  • 第一节 部分非线性单指标模型14
  • 第二节 部分非线性单指标模型(PNSIM)分位数回归14-19
  • 第三节 估计量的渐近性质19-20
  • 第四节 部分非线性单指标模型的变量选择20-21
  • 第五节 模拟21-27
  • 第六节 实例分析27-30
  • 第七节 总结30
  • 第八节 定理证明30-35
  • 第三章 离散数据分位数回归变量选择35-42
  • 第一节 离散数据的分位数回归35-36
  • 第二节 离散数据的分位数变量选择36-37
  • 第三节 离散数据分位数变量选择算法37-38
  • 第四节 模拟38-39
  • 第五节 本章小结39
  • 第六节 定理证明39-42
  • 第四章 结论与展望42-43
  • 参考文献43-47
  • 附录47-48
  • 致谢48-49

【相似文献】

中国期刊全文数据库 前10条

1 杨丽霞;魏立力;;基于粗糙集方法的有序尺度变量选择[J];宁夏大学学报(自然科学版);2009年02期

2 赵宇;黄思明;;带有变量选择过程的分类模型误差分析[J];数学的实践与认识;2010年17期

3 樊亚莉;徐群芳;;稳健的变量选择方法及其应用[J];上海理工大学学报;2013年03期

4 陶靖轩;多元分析中的变量选择问题研究[J];中国计量学院学报;2001年01期

5 李树军,纪宏金;对应聚类分析与变量选择[J];地球物理学进展;2005年03期

6 陈黎明;赵永红;;转换函数未知时转换模型的变量选择[J];四川大学学报(自然科学版);2011年05期

7 刘民千,张润楚;超饱和设计的变量选择[J];南开大学学报(自然科学版);2000年03期

8 王进;;聚类分析中的距离与变量选择[J];山西财经大学学报;2007年S1期

9 张波;方国斌;;高维面板数据降维与变量选择方法研究[J];统计与信息论坛;2012年06期

10 高仁祥,张世英,刘豹;基于神经网络的变量选择方法[J];系统工程学报;1998年02期

中国重要会议论文全文数据库 前6条

1 张俊华;方伟武;;调查表分析中变量选择的一些方法(英文)[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年

2 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

3 李慷;席裕庚;;复杂过程系统中操作变量选择与定位的方法研究[A];1993年控制理论及其应用年会论文集[C];1993年

4 云永欢;王为婷;梁逸曾;;迭代的保留有信息变量来筛选最佳变量子集的一种多元校正变量选择方法[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

5 徐登;范伟;梁逸曾;;紫外光谱结合变量选择和偏最小二乘回归同时测定水中重金属镉、锌、钴[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

6 梁逸曾;李洪东;许青松;曹东升;张志敏;;灰色化学建模与模型集群分析——兼论过拟合、稳健估计、变量选择与模型评价[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

中国博士学位论文全文数据库 前10条

1 王大荣;分散度量模型中的变量选择[D];北京工业大学;2009年

2 王明秋;高维数据下若干回归模型的变量选择问题研究[D];大连理工大学;2012年

3 刘吉彩;生存数据统计模型的变量选择方法[D];华东师范大学;2014年

4 樊亚莉;稳健变量选择方法的若干问题研究[D];复旦大学;2013年

5 唐凯临;变量选择和变换的新方法研究[D];同济大学;2008年

6 董莹;高维共线性统计模型的参数估计与变量选择[D];大连理工大学;2014年

7 叶飞;相对误差准则下的估计理论和变量选择方法的研究[D];清华大学;2013年

8 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年

9 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年

10 姬永刚;分位数回归中的贝叶斯变量选择[D];东北师范大学;2012年

中国硕士学位论文全文数据库 前10条

1 赵冬琦;基于变量选择的股指期货对股票市场影响的实证研究[D];兰州大学;2015年

2 程勇;多水平模型的变量选择在农户人均收入数据中的应用[D];云南财经大学;2015年

3 邓秋玲;SCAD和ADS方法在比例风险模型中的应用[D];广西大学;2015年

4 韦新星;几种变量选择方法在Cox模型中的应用[D];广西大学;2015年

5 王唯;部分线性模型的变量选择问题研究[D];湘潭大学;2015年

6 徐国盛;若干模型的分位数变量选择[D];浙江财经大学;2016年

7 闫闯;多元回归模型中变量选择问题研究[D];黑龙江大学;2011年

8 康赞亮;计量经济学模型变量选择与设定的理论方法研究[D];清华大学;2009年

9 张丹;乘积模型的变量选择[D];河南大学;2014年

10 郝亚楠;基于L_2-Fused Lasso变量选择方法的性质及应用研究[D];北京交通大学;2014年



本文编号:1067435

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/1067435.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6ad33***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com