变量和样本同时选择的序贯方法
发布时间:2021-05-16 09:04
随着科技对生活和工业的改变,数据的来源越来越丰富,数据量也在以惊人的速度增长.海量的数据不仅使我们可以拥有比以往更多的数据进行建模分析,模型的精度也因此可以得到大幅提升.然而,如此巨量数据的统计分析仍然具有挑战;一方面,收集的变量越来越多,尽管这些冗余的变量不会过分影响模型的预测能力,但由于相当大一部分变量与模型无关,因此会降低模型本身的解释能力;另一方面,虽然样本量在以指数级的速度增长,但是冗余数据也在相应地增加,这些数据不仅对模型估计的贡献不大,还会增加模型的计算负担,因此造成计算资源的不必要浪费.对于前者变量过多的问题,已有众多关于变量选择的方法研究,然而目前较少工作涉及样本选择.于是本文试对样本选择的问题进行探讨,并提出在样本选择的过程中同时进行变量选择的统计方法.本文首先研究多维响应变量的广义线性模型的序贯估计方法.在第2章中通过序贯分析的方法解决了样本选择应该选择多少样本的问题,并且在这个样本量下能够保证模型的可靠性(如满足给定精度的模型系数).本章采用拟似然方程估计,放松了一般广义线性模型对响应变量的假定,使得多维响应变量的广义线性模型的应用更加灵活.本章分别在设计阵为固...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:96 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
符号说明
第1章 绪论
1.1 序贯分析方法介绍
1.2 背景知识
1.2.1 广义线性模型
1.2.2 乘积模型与相对误差准则
1.3 本文研究内容及结构
第2章 基于拟似然估计方程估计的序贯方法
2.1 引言
2.2 基础准备与模型设定
2.3 固定宽度的置信区域估计的序贯分析方法
2.3.1 设计阵为固定设计情形
2.3.2 设计阵为自适应设计情形
2.4 主要定理证明
2.4.1 引理2.12及证明
2.4.2 定理2.4的证明
2.4.3 定理2.5的证明
2.4.4 引理2.13及证明
2.4.5 定理2.9的证明
2.4.6 定理2.10的证明
2.5 本章小结
第3章 基于拟似然估计方程的同时变量选择的序贯方法
3.1 引言
3.2 模型设置
3.3 自适应压缩估计
3.4 带变量压缩的序贯方法
3.5 修正的序贯D-准则
3.6 数值模拟
3.6.1 模拟数据
3.6.2 实际数据
3.7 定理证明
3.7.1 引理3.2的证明
3.7.2 定理3.1的证明
3.7.3 定理3.3的证明
3.7.4 定理3.4的证明
3.8 本章小节
第4章 基于乘积相对误差准则的同时变量选择的序贯方法
4.1 引言
4.2 光滑门限变量选择
4.3 带变量选择的序贯分析
4.4 序贯样本的快速选择策略
4.5 数值模拟
4.6 定理证明
4.6.1 引理4.4
4.6.2 引理4.5的证明
4.6.3 定理4.1的证明
4.6.4 定理4.3的证明
4.7 本章小结
参考文献
附录
致谢
在读期间发表的学术论文与取得的研究成果
【参考文献】:
期刊论文
[1]构造泊松均值固定宽度置信区间的序贯方法和两阶段方法[J]. 李二倩,钱曼玲,田茂再. 系统科学与数学. 2018(11)
[2]Asymptotic Properties of Maximum Quasi-Likelihood Estimators in Generalized Linear Models with Diverging Number of Covariates[J]. GAO Qibing,DU Xiuli,ZHOU Xiuqing,XIE Fengchang. Journal of Systems Science & Complexity. 2018(05)
[3]零膨胀泊松分布参数的固定宽度置信区间构造方法[J]. 李二倩,田茂再. 应用概率统计. 2018(01)
[4]Sequential Estimate for Generalized Linear Models with Uncertain Number of Effective Variables[J]. LU Haibo,WANG Zhanfeng,WU Yaohua. Journal of Systems Science & Complexity. 2015(02)
[5]序贯抽样在计算机辅助电话调查中的应用[J]. 金勇进,王华. 数理统计与管理. 2006(06)
[6]ASYMPTOTIC NORMALITY OF QUASI MAXIMUM LIKELIHOOD ESTIMATE IN GENERALIZED LINEAR MODELS[J]. YUE LI CHEN XIRU School of Mathematics and Statistics, Wuhan University, Wuhan 430072, China. Graduate School of the Chinese Academy of Sciences, Beijing 100049, China.. Chinese Annals of Mathematics. 2005(03)
[7]广义线性模型中拟极大似然估计的强相合性及收敛速度[J]. 岳丽,陈希孺. 中国科学(A辑:数学). 2004(02)
[8]正态总体中方差的两步置信区间(英文)[J]. 王海贤,曾建军,陈桂景. 应用概率统计. 2003(02)
[9]左删失右截断数据的分位数的固定宽度序贯置信区间估计[J]. 周勇,吴国富. 应用数学学报. 2002(02)
[10]Stein两阶段抽样问题中第一阶段最优抽样量研究[J]. 曾建军. 应用概率统计. 1998(03)
本文编号:3189402
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:96 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
符号说明
第1章 绪论
1.1 序贯分析方法介绍
1.2 背景知识
1.2.1 广义线性模型
1.2.2 乘积模型与相对误差准则
1.3 本文研究内容及结构
第2章 基于拟似然估计方程估计的序贯方法
2.1 引言
2.2 基础准备与模型设定
2.3 固定宽度的置信区域估计的序贯分析方法
2.3.1 设计阵为固定设计情形
2.3.2 设计阵为自适应设计情形
2.4 主要定理证明
2.4.1 引理2.12及证明
2.4.2 定理2.4的证明
2.4.3 定理2.5的证明
2.4.4 引理2.13及证明
2.4.5 定理2.9的证明
2.4.6 定理2.10的证明
2.5 本章小结
第3章 基于拟似然估计方程的同时变量选择的序贯方法
3.1 引言
3.2 模型设置
3.3 自适应压缩估计
3.4 带变量压缩的序贯方法
3.5 修正的序贯D-准则
3.6 数值模拟
3.6.1 模拟数据
3.6.2 实际数据
3.7 定理证明
3.7.1 引理3.2的证明
3.7.2 定理3.1的证明
3.7.3 定理3.3的证明
3.7.4 定理3.4的证明
3.8 本章小节
第4章 基于乘积相对误差准则的同时变量选择的序贯方法
4.1 引言
4.2 光滑门限变量选择
4.3 带变量选择的序贯分析
4.4 序贯样本的快速选择策略
4.5 数值模拟
4.6 定理证明
4.6.1 引理4.4
4.6.2 引理4.5的证明
4.6.3 定理4.1的证明
4.6.4 定理4.3的证明
4.7 本章小结
参考文献
附录
致谢
在读期间发表的学术论文与取得的研究成果
【参考文献】:
期刊论文
[1]构造泊松均值固定宽度置信区间的序贯方法和两阶段方法[J]. 李二倩,钱曼玲,田茂再. 系统科学与数学. 2018(11)
[2]Asymptotic Properties of Maximum Quasi-Likelihood Estimators in Generalized Linear Models with Diverging Number of Covariates[J]. GAO Qibing,DU Xiuli,ZHOU Xiuqing,XIE Fengchang. Journal of Systems Science & Complexity. 2018(05)
[3]零膨胀泊松分布参数的固定宽度置信区间构造方法[J]. 李二倩,田茂再. 应用概率统计. 2018(01)
[4]Sequential Estimate for Generalized Linear Models with Uncertain Number of Effective Variables[J]. LU Haibo,WANG Zhanfeng,WU Yaohua. Journal of Systems Science & Complexity. 2015(02)
[5]序贯抽样在计算机辅助电话调查中的应用[J]. 金勇进,王华. 数理统计与管理. 2006(06)
[6]ASYMPTOTIC NORMALITY OF QUASI MAXIMUM LIKELIHOOD ESTIMATE IN GENERALIZED LINEAR MODELS[J]. YUE LI CHEN XIRU School of Mathematics and Statistics, Wuhan University, Wuhan 430072, China. Graduate School of the Chinese Academy of Sciences, Beijing 100049, China.. Chinese Annals of Mathematics. 2005(03)
[7]广义线性模型中拟极大似然估计的强相合性及收敛速度[J]. 岳丽,陈希孺. 中国科学(A辑:数学). 2004(02)
[8]正态总体中方差的两步置信区间(英文)[J]. 王海贤,曾建军,陈桂景. 应用概率统计. 2003(02)
[9]左删失右截断数据的分位数的固定宽度序贯置信区间估计[J]. 周勇,吴国富. 应用数学学报. 2002(02)
[10]Stein两阶段抽样问题中第一阶段最优抽样量研究[J]. 曾建军. 应用概率统计. 1998(03)
本文编号:3189402
本文链接:https://www.wllwen.com/shoufeilunwen/sklbs/3189402.html