内存约束下的高维变系数分位数回归模型
发布时间:2021-03-12 01:29
近年来,统计学研究的热点集中到高维数据分析板块。从数据的维度出发,数据的特点可以概括为样本量极其大,特征数非常多。分别对应于人们对事物观测的频率及数量增加,角度及渠道增多。这些特征表现在经济、社会、科学中的各个领域,这些领域越来越重视数据的作用,其发展受到数据的驱动。这催促着作为工具的计算机和统计方法需要适应时代的要求。在大数据的环境下,硬件基础设施,高效的计算方法,统计分析方法是相辅相成的。硬件设施如计算机内存,计算机处理能力,获取数据的渠道及储存数据的介质等影响着后两者的方法运用。计算方法决定了进行数据分析的时间花费和稳定性。统计方法保障了结果的精确性。而事实上,不同统计方法也受制于样本特征,在高维度海量数据中,传统的优良方法往往失效。这些限制给当下的数据科学家们带来挑战。大规模的数据分析任务往往需要优质的基础平台,快速的计算方法以及相适应的统计学理论加持。然而现实中这类数据对计算机处理统计模型造成了阻碍。很多时候,计算机由于内存的限制无法处理大规模的数据。这在当下各个领域所方便获取和廉价储存的高频率、高维度数据来说是徒劳的,导致无法及时利用总体数据中的信息。诸如生物医疗的数据,基...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
Chapter 1 Introduction
1.1 Background
1.2 Source and Significance
1.3 Literature Review
1.4 Research Contents and Structure
1.4.1 Research Contents
1.4.2 Thesis Outline
1.5 Brief Summary
Chapter 2 Distributed Processing
2.1 Numerical Optimization Algorithm
2.2 Method in Statistics
2.3 Brief Summary
Chapter 3 Quantile Regression Model
3.1 Quantile Varying Coefficients Regression
3.1.1 General Form
3.1.2 Variable Selection in High-Dimensional Data
3.1.3 Distributed Regression Model under Memory Constraint
3.2 Asymptotic Properties
3.3 Brief Summary
Chapter 4 Empirical Results
4.1 Numerical Simulations
4.2 Real Data Example
4.3 Brief Summary
Conclusions
结论
References
Acknowledgements
本文编号:3077446
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
Chapter 1 Introduction
1.1 Background
1.2 Source and Significance
1.3 Literature Review
1.4 Research Contents and Structure
1.4.1 Research Contents
1.4.2 Thesis Outline
1.5 Brief Summary
Chapter 2 Distributed Processing
2.1 Numerical Optimization Algorithm
2.2 Method in Statistics
2.3 Brief Summary
Chapter 3 Quantile Regression Model
3.1 Quantile Varying Coefficients Regression
3.1.1 General Form
3.1.2 Variable Selection in High-Dimensional Data
3.1.3 Distributed Regression Model under Memory Constraint
3.2 Asymptotic Properties
3.3 Brief Summary
Chapter 4 Empirical Results
4.1 Numerical Simulations
4.2 Real Data Example
4.3 Brief Summary
Conclusions
结论
References
Acknowledgements
本文编号:3077446
本文链接:https://www.wllwen.com/kejilunwen/yysx/3077446.html