结合队列数据与横截面数据的函数型混合效应模型分析

发布时间：2024-06-23 11:52

　　在生物医学等众多领域中,有时会有几个不同来源、不同类型的数据集针对同一问题进行研究。例如,在婴幼儿生长的影响因素研究中,研究者既会收集规模较小的队列数据,也会收集规模较大的基于抽样调查的横截面数据。由于两者数据类型不同,研究者通常对他们分别建模分析。但由于这两类数据研究的问题相同,搜集的变量相似,如能将两者有机结合,进行联合建模,将会显著提高总的样本量,大大提升研究的效果。目前这方面的研究很少,本文将重点研究将队列数据与横截面数据联合建模的方法,并将该方法应用到婴幼儿生长的影响因素分析中。本文首先介绍了k均值聚类算法,以及如何通过k均值聚类算法,将每个个体只有一次观测值的横截面数据,聚类成每个个体具有多次观测值的伪队列数据。接着,本文介绍了一种已有的函数型混合效应模型,并重点介绍如何在此基础上开发出一种拓展的函数型混合效应模型。原模型在对队列数据进行分析的时候,所有个体的随机效应对应同一个协方差函数γ(t,s),所有个体的测量误差对应同一个时变方差函数σ²(t)。拓展后的模型中,对于不同组别的队列数据,引入了不同的协方差函数以及误差方差函数。在对真实队列数据与伪队...

【文章页数】：45 页

【学位级别】：硕士

【部分图文】：

图2-1k均值聚类迭代图

第二章方法介绍聚类算法:具体算法流程如下，其中k是指定的类的个数，质心是每个类的均值向量，距离量度则常用欧几里得距离和余弦相似度。1，首先确定一个k值，即将数据集聚为k个类别。2，从数据集中随机选择k个数据点作为质心。3，对数据集中每一个点，计算其与每一个质心的距离(如欧式距离)....

图3-3不平衡样本量下的模拟估计结果:μ(t)

第三章模拟研究图3-3不平衡样本量下的模拟估计结果:μ(t)以及它的95%置信带.(第1,2,3行依次对应情形V,VI,VII;方法JFMM,CW依次对应第1,2列)-20-

图3-4不平衡样本量下的模拟估计结果:β(情形V,VI,VII;方法JFMM,CW依次对应第1

§3.2模拟结果分析图3-4不平衡样本量下的模拟估计结果:β(t)以及它的95%置信带.(第1,2,3行依次对应情形V,VI,VII;方法JFMM,CW依次对应第1,2列)-21-

图4-1横截面数据观测时间点分布

第四章实际数据分析本章对两组有关婴幼儿生长的的实际数据集进行联合建模分析。本章首先介绍了实际数据的来源与结构，其次通过k均值聚类将横截面数据聚类成为伪队列数据，最后用本文提出的新方法JFMM以及已有方法CW分别对由伪队列数据及真实队列数据构成的联合数据集进行分析与比较。§4.1数....

本文编号：3995425

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3995425.html

上一篇：西藏班公湖-怒江缝合带中段依拉山蛇绿岩中铬铁矿特征及构造背景
下一篇：没有了

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|