基于自适应组Lasso算法的线性回归模型多变点估计
发布时间:2020-12-11 04:43
变点问题一直是学术界的热门话题。本文运用基于GMD(Groupwise Majorization Descent)算法的自适应组Lasso来求解多元线性回归模型的变点问题。数值模拟表明,在计算速度方面,该算法明显优于稀疏组Lasso。在估计精度方面,该方法可以正确估计变点数量,变点位置估计误差较小,并克服了自适应Lasso和稀疏组Lasso存在的“变点集聚”的问题。本文也给出了这个方法在求解变点问题上优于其他算法的四个原因。首先,自适应组Lasso是由两步组Lasso组成的,相当于进行了两次变点筛选,有助于提高变点估计的准确性。其次,本文将线性回归模型的变点问题转化为高维回归模型的变量选择问题。由于变量具有比较明显的组结构,所以相比于单变量的稀疏性,我们更关注组变量的稀疏性,因此组Lasso比Lasso更适合求解本文的问题。其三,我们使用GMD算法来求解组Lasso,有效提高了本文方法的求解速度,最后,相比于传统方法先估计变点数量再估计变点的位置和模型参数,本方法可以同时估计变点的数量、位置和模型参数,有利于提高估计精度。本文还将该方法应用于和空气质量有关的实际数据中,验证该算法在实际...
【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 研究思路
1.3 研究框架
1.4 创新和不足
第二章 文献综述
2.1 基于传统方法的变点问题文献综述
2.2 基于Lasso理论的变点问题文献综述
2.3 本章小结
第三章 理论方法
3.1 线性回归模型的变点问题
3.1.1 含有变点的线性回归模型
3.1.2 变点问题转化为高维回归问题
3.2 Lasso及其相关方法
3.2.1 Lasso
3.2.2 自适应Lasso
3.2.3 组Lasso
3.2.4 自适应组Lasso
3.2.5 稀疏组Lasso
3.3 GMD(Groupwise Majorization Descent)算法
3.4 基于CUSUM (Cumulative Sum)检验的变点检测
3.5 本章小结
第四章 模拟研究
4.1 运算时间对比
4.1.1 短数据的计算时间对比
4.1.2 长数据的计算时间对比
4.2 估计精度对比
4.2.1 短数据的估计精度对比
4.2.2 长数据的估计精度对比
4.3 本章小结
第五章 实证研究
5.1 空气质量和风力的实证研究
5.2 指标选取
5.3 建模和变点估计结果分析
5.4 本章小结
第六章 结论和展望
参考文献
致谢
本文编号:2909927
【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 研究思路
1.3 研究框架
1.4 创新和不足
第二章 文献综述
2.1 基于传统方法的变点问题文献综述
2.2 基于Lasso理论的变点问题文献综述
2.3 本章小结
第三章 理论方法
3.1 线性回归模型的变点问题
3.1.1 含有变点的线性回归模型
3.1.2 变点问题转化为高维回归问题
3.2 Lasso及其相关方法
3.2.1 Lasso
3.2.2 自适应Lasso
3.2.3 组Lasso
3.2.4 自适应组Lasso
3.2.5 稀疏组Lasso
3.3 GMD(Groupwise Majorization Descent)算法
3.4 基于CUSUM (Cumulative Sum)检验的变点检测
3.5 本章小结
第四章 模拟研究
4.1 运算时间对比
4.1.1 短数据的计算时间对比
4.1.2 长数据的计算时间对比
4.2 估计精度对比
4.2.1 短数据的估计精度对比
4.2.2 长数据的估计精度对比
4.3 本章小结
第五章 实证研究
5.1 空气质量和风力的实证研究
5.2 指标选取
5.3 建模和变点估计结果分析
5.4 本章小结
第六章 结论和展望
参考文献
致谢
本文编号:2909927
本文链接:https://www.wllwen.com/kejilunwen/yysx/2909927.html