广义线性模型的错误发现率研究
发布时间:2021-07-26 13:23
广义线性模型是由Nelder和Wedderburn于1972年提出的一个重要模型,它放松了线性模型要求响应变量是高斯分布的条件,在实际问题中应用更为广泛.该模型将响应变量的分布推广到指数分布族,可以处理响应变量为离散型和连续型的回归问题.特别是离散型随机变量,广义线性模型因此对处理生物、医学等领域中常见的属性数据、计数数据有着重要意义.同时随着科学技术的快速发展,人们需要处理的数据愈发复杂,维度也越来越高,如何高效的从数据中获取信息日趋重要.因此,变量选择作为统计建模的重要手段得到了长足的发展.基于广义线性模型的广泛应用和变量选择问题的重要性,本文考虑广义线性模型中,回归参数多重假设检验的FDR控制问题,本质上也是变量选择的FDR控制问题.研究目标是在有效进行变量选择的同时,保证不会选入过多的不重要变量.受Barber和Candes(2015)于线性模型下提出的knockoff方法启发,提出GLM-knockoff方法.GLM-knockoff方法的主要思想是通过模仿原相关矩阵的协方差结构,对每个变量构造一个knockoff变量作为控制变量,从而控制变量选择的FDR.本文首先从理论上证...
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:42 页
【学位级别】:硕士
【部分图文】:
L.iSgisti}回归中不重要变量P值的分布
图3-4例3.2不同信号强度对GLM-knockoff方法FDR和Pow的影响??Figure?3-4?The?effect?of?varying?the?amplitude?to?the?FDR?and?the?Pow?of?the?GLM-knockoff?for??Example?3.2??果.固定信号强度A?=?1.0和模型稀疏程度fc?=?5,取不同的变纛顏关水平p时的模??拟结果见围3-6.在圈3-4到3-6中4?GLM-knockoff?和GLM-knockoff+分别___(2-6)式??和(2-7)式所代表的两种方法.??由图3-4至图3-6可知,在上述所有情况下,GLM-knockoff+均可以成功将FDR控??制在预先给定的水乎20%.而GLM-knockoff不能严格控制FDR,这与第2.3节的理论??结果一致,即GLM-knockoff只可以控制近似FDR.至于该方法的Pow,由面可知,Pois???son?模型中信号强度越小,模型越稀疏,变量之间相关性越小,?方法的?Pow?越大,即该??-23?-??
本文编号:3303646
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:42 页
【学位级别】:硕士
【部分图文】:
L.iSgisti}回归中不重要变量P值的分布
图3-4例3.2不同信号强度对GLM-knockoff方法FDR和Pow的影响??Figure?3-4?The?effect?of?varying?the?amplitude?to?the?FDR?and?the?Pow?of?the?GLM-knockoff?for??Example?3.2??果.固定信号强度A?=?1.0和模型稀疏程度fc?=?5,取不同的变纛顏关水平p时的模??拟结果见围3-6.在圈3-4到3-6中4?GLM-knockoff?和GLM-knockoff+分别___(2-6)式??和(2-7)式所代表的两种方法.??由图3-4至图3-6可知,在上述所有情况下,GLM-knockoff+均可以成功将FDR控??制在预先给定的水乎20%.而GLM-knockoff不能严格控制FDR,这与第2.3节的理论??结果一致,即GLM-knockoff只可以控制近似FDR.至于该方法的Pow,由面可知,Pois???son?模型中信号强度越小,模型越稀疏,变量之间相关性越小,?方法的?Pow?越大,即该??-23?-??
本文编号:3303646
本文链接:https://www.wllwen.com/kejilunwen/yysx/3303646.html