当前位置:主页 > 医学论文 > 临床医学论文 >

临床医学纵向数据的分析方法研究

发布时间:2017-09-08 10:52

  本文关键词:临床医学纵向数据的分析方法研究


  更多相关文章: 纵向数据 聚类分析 变量选择 数据分组处理算法 多层线性模型


【摘要】:随着医学技术的发展,医学数据也在大量的积累。为迎合临床诊断、科研教学方面的需求,临床医学数据分析技术逐渐成为临床医学领域研究的热点。临床医学数据主要包括截面数据,时间序列数据和纵向数据。截面数据是指在同一次调查中得到的数据,在医学上可以用来分析疾病的影响因素。时间序列数据是指随着时间的变化收集到的数据。不同于上面两种数据,纵向数据是把截面数据和时间序列数据相结合的方式,在临床上以随访的方式收集到的多个患者的检测数据。通过分析纵向数据,能得到个体特征随时间变化的趋势,也可以分析出个体之间的差异性。因此临床纵向数据的分析有着很重要的医学意义。本文在对临床医学纵向数据的特点进行分析后,提出了面向医学纵向数据的聚类分析算法和变量选择算法。然后建立了改进了的多层线性模型,并通过分析实际的临床医学纵向数据验证了我们的多层线性模型在临床医学纵向数据研究中的有效性。本文的研究工作内容具体如下:(1)根据医生长期的临床经验,尤其结合中医对患者体质的区分思想,即使同一病种、同一分期的患者,其疾病发展的趋势也不尽相同,而且医生经验往往认为这些患者的疾病发展趋势可以进一步细分为几类。也就是说,一些病人之间往往会存在相似的病理发展趋势或者相同的症状,但是对研究人群而言,到底疾病变化趋势的发展分为几类,医生经验无法给出。因此,需要根据医学纵向数据将病人的疾病发展趋势进行聚类分析,得到的类别可以给医生提供一些诊疗建议。考虑到临床医学纵向数据多维度的特点,我们提出扩展范式距离来度量病人间的相似性,并结合不受聚类中心随机选择影响的改进K均值算法进行纵向数据的聚类分析。然后对非小细胞肺癌纵向数据和妊娠高血压纵向数据分别进行了对比实验。实验结果表明,我们的方法可以对纵向数据可以实现更有效的聚类,其有效性和可行性适用于以聚类分析为目的的临床医学纵向数据的分析。(2)在临床医学纵向数据分析中,由于纵向数据的维度比较多,会加大建模的困难,所以在实际建模中,我们需要选择对病症影响比较大的特征来作为模型的输入。本文提出了基于GMDH算法的变量选择算法,考虑到该算法具有选择出与因变量密切相关的自变量的特点,本文将此方法用于临床医学纵向数据的变量选择中,这在本人所查阅的文献中尚未见到类似应用。通过在非小细胞肺癌纵向数据实验上的应用,可以得到该方法不仅能有效减少数据维度和算法复杂度,而且能保证有效的聚类结果。(3)针对纵向数据的特点,首先分析了多层线性模型在临床纵向数据处理上的一些的优点和局限性,无法分析随时间变化的指标对病症的影响,本文提出将纵向数据中时变的变量先进行聚类,然后再进行多层线性模型分析,进而改进了多层线性模型。然后,将改进后的模型应用到非小细胞肺癌纵向数据和妊娠高血压数据中,分析得到了病症的变化趋势,以及个体之间的差异性,为医生提供了一些诊疗建议。实验结果表明我们所提出的基于时变变量聚类的多层线性模型,能够解决时变变量不便在这类模型中作为自变量应用的现状。
【关键词】:纵向数据 聚类分析 变量选择 数据分组处理算法 多层线性模型
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R4;TP311.13
【目录】:
  • 摘要4-6
  • Abstract6-10
  • 第1章 绪论10-18
  • 1.1 课题研究背景及意义10-11
  • 1.2 纵向数据分析方法的国内外研究现状11-14
  • 1.2.1 纵向数据聚类分析的研究现状12-13
  • 1.2.2 变量选择算法的研究现状13
  • 1.2.3 纵向数据建模的研究现状13-14
  • 1.3 本文的主要内容14-15
  • 1.4 本文的组织结构15-18
  • 第2章 基于临床医学纵向数据建模方案设计18-24
  • 2.1 临床纵向数据建模的整体方案18-20
  • 2.2 研究数据及特征20-21
  • 2.2.1 研究数据集介绍20
  • 2.2.2 实验数据指标的介绍20-21
  • 2.2.3 数据特点分析21
  • 2.3 本章小结21-24
  • 第3章 基于EFros距离的改进的K均值聚类算法的研究24-38
  • 3.1 聚类分析方法24-25
  • 3.2 相似性度量方法的研究25-28
  • 3.2.1 相似性度量方法26-27
  • 3.2.2 常用聚类算法27-28
  • 3.3 基于EFros距离的改进的K均值聚类算法的研究28-31
  • 3.3.1 基本思路28-29
  • 3.3.2 算法步骤29-30
  • 3.3.3 聚类效果评价30-31
  • 3.4 实验及分析31-35
  • 3.4.1 非小细胞肺癌数据聚类实验31-33
  • 3.4.2 妊娠高血压数据聚类实验33-35
  • 3.5 本章小结35-38
  • 第4章 基于GMDH算法的纵向数据变量选择方法研究38-46
  • 4.1 变量选择方法的研究38-39
  • 4.1.1 子集选择方法38
  • 4.1.2 惩罚估计方法38-39
  • 4.2 GMDH理论的研究39-41
  • 4.2.1 GMDH的基本概念39-40
  • 4.2.2 GMDH的建模过程40
  • 4.2.3 GMDH算法的实现流程40-41
  • 4.3 基于GMDH算法的纵向数据变量选择算法的研究41-42
  • 4.3.1 面向GMDH算法的纵向数据41-42
  • 4.3.2 基于GMDH算法的纵向数据变量选择算法42
  • 4.4 实验及分析42-44
  • 4.5 本章小结44-46
  • 第5章 面向临床医学纵向数据的改进的多层线性模型建模方法研究46-60
  • 5.1 多层线性模型的描述46-47
  • 5.2 纵向数据下的多层线性模型原理47-48
  • 5.3 面向纵向临床数据的多层线性模型建模方法的研究48-49
  • 5.3.1 多层线性模型下的纵向数据48-49
  • 5.3.2 面向纵向数据多层线性模型输入的改进49
  • 5.4 实验及分析49-58
  • 5.4.1 非小细胞肺癌数据实验50-55
  • 5.4.2 妊娠高血压医学数据实验55-58
  • 5.5 本章小结58-60
  • 结论与展望60-62
  • 参考文献62-66
  • 攻读硕士学位期间所发表的学术成果66-68
  • 致谢68

【相似文献】

中国期刊全文数据库 前7条

1 李春红;张忠占;;纵向数据下药物剂量水平的统计分析[J];高校应用数学学报A辑(中文版);2006年03期

2 庄严;邢艳春;马文卿;;含有缺失机制的多元纵向数据分析[J];中国卫生统计;2008年05期

3 李雷德;祁瑞;行岳真;隋虹;;广义估计方程与准最小二乘在社区纵向数据分析中的应用[J];实用预防医学;2013年11期

4 刘沛,王灿楠;在医学纵向数据分析中SAS内部逻辑变量的应用[J];中国卫生统计;2001年01期

5 冯丽云;James Cui;;纵向数据准似然独立准则在GEE模型中的应用[J];中国卫生统计;2008年04期

6 廉启国;高尔生;涂晓雯;楼超华;;Stata中xtmixed与xtgee相对于纵向数据分析的比较[J];中国卫生统计;2007年05期

7 ;[J];;年期

中国重要会议论文全文数据库 前1条

1 韦博成;解锋昌;林金官;;ZI数据的统计分析[A];江苏省现场统计研究会第11次学术年会论文集[C];2008年

中国博士学位论文全文数据库 前8条

1 徐丽丽;带有混合相关结构的纵向数据的统计分析[D];东北师范大学;2011年

2 张涛;含有测量误差的纵向数据的统计推断[D];复旦大学;2011年

3 田瑞琴;纵向数据下半参数回归模型的统计推断[D];北京工业大学;2014年

4 严国义;纵向数据与生存数据的半参数联合模型研究[D];武汉大学;2013年

5 胡爽;经验似然纵向数据和似然Dantzig Selector方法[D];山东大学;2011年

6 肖立群;响应变量受限纵向数据中若干统计问题的研究[D];中国科学技术大学;2014年

7 李万斌;纵向数据下变系数混合效应模型的有效推断[D];北京工业大学;2014年

8 许佩蓉;高维纵向数据中边际模型和混合效应模型的若干研究[D];华东师范大学;2013年

中国硕士学位论文全文数据库 前10条

1 陈丽芳;纵向数据下半参数工具变量模型的二次推断函数估计及应用[D];重庆工商大学;2016年

2 陈登峰;纵向数据下两类半参数回归模型的二次光滑估计[D];北京工业大学;2016年

3 孙延辉;临床医学纵向数据的分析方法研究[D];北京工业大学;2016年

4 石琳;纵向数据处理中的异方差分析[D];山东科技大学;2008年

5 韩旭;简单序约束下基于二次推断函数的纵向数据模型选择方法[D];东北师范大学;2011年

6 姜丹丹;含有有序变量和连续变量的多元纵向数据分析[D];东北师范大学;2007年

7 庄严;含有缺失机制的多元纵向数据分析[D];东北师范大学;2007年

8 范俊花;具有一致相关和指数相关的纵向数据模型中异方差和相关性检验[D];东南大学;2006年

9 赵晓云;纵向数据缺失处理对分析模型影响的研究[D];天津财经大学;2013年

10 戴小飞;纵向数据混合效应模型的研究[D];扬州大学;2009年



本文编号:813611

资料下载
论文发表

本文链接:https://www.wllwen.com/linchuangyixuelunwen/813611.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d6159***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com