广义线性混合模型中的通信有效分布式统计计算

发布时间:2020-12-12 10:25
  在实际应用中,人们广泛使用线性混合模型(linear mixed models,简称LMMs)、广义线性模型(generalized linear models,简称GLMs)、广义线性混合模型(generalized linear mixed models,简称GLMMs)等工具来分析各类实际数据。特别地,其中广义线性混合模型在非寿险精算,医学,生态学,传染病学等领域中存在大量潜在应用。然而,相比其他模型而言,广义线性混合模型的估计涉及高维积分问题,因此其实际计算较为困难。在现有文献中,Breslow和Clayton(1993)[3]最早探讨了如何采用Laplace方法进行快速近似计算相关拟似然估计的问题,并提出了一类基于惩罚拟似然的计算方法(简记为PQL,Penalized Quasi-Likelihood),并推导了相关方法的理论性质。然后,近年来随着数据搜集越来越便利,海量数据逐渐出现,这给相关模型的实际应用带来极大挑战。在大数据情形下,Jordan等(2018)[18]提出了针对线性模型、广义线性等模型的通信有效推断方法。考虑到Jo... 

【文章来源】:江西财经大学江西省

【文章页数】:60 页

【学位级别】:硕士

【部分图文】:

广义线性混合模型中的通信有效分布式统计计算


PQL和CSQL方法的性能与数据分割数的关系

数据分割,性能,方法,截距


广义线性混合模型中的通信有效分布式统计计算36表示)、出院倾向(用dischargedisposition表示)、入院医师的医学专业(用medicalspecialtyoftheadmittingphysician表示)、住院时间(用timespentinhospital表示)。这些协变量都在BeataStrack等(2014)[38]的表1中进行了描述。每个患者EncounterID被认为是随机效应,拟合的模型可表达成以下形式:(μ)=0Χ0+1Χ1+2Χ2+3Χ3+4Χ4+5Χ5+6Χ6+其中,μ=Readmission,Χ0=Gender,Χ1=Age,Χ2=Rac,Χ3=Admissionsource,Χ4=Dischargedisposition,Χ5=medicalspecialty,Χ6=Timespentinhospital,(=1,,6;=1,,)是logistic回归的固定效应,是第个患者的EncounterID的随机截距。图2:混合logistic回归PQL和CSQL方法的性能与数据分割数的关系3.4本章小结本章展开解释了实证数据分析,运用数字研究和教育研究所(InstituteforDigitalResearchandEducation,简称IDRE)的数据与UC-Irvine机器学习库数据集的实证数据进行了实证分析,具体得出的结论如下:(1)本章首先对IDRE的数据选取这些变量:年龄(用Age表示),结婚的(用Married表示),性别(用Sex表示),(4)红细胞(RedBloodCell简称RBC),白细胞(WhiteBloodCell简称WBC)和每个医生的固定截距和随机截距来说明


本文编号:2912374

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2912374.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c480b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com