当前位置:主页 > 硕博论文 > 医学硕士论文 >

基于连续贝叶斯网络的尿酸相关因素应用研究

发布时间:2020-11-01 06:19
   目的:研究基于偏相关的连续贝叶斯网络结构学习算法,并与离散结构学习算法MMHC进行比较。针对连续变量的离散化可能导致信息丢失的问题,采用仿真数据来检验IPCB连续结构学习算法充分利用数据信息准确构建网络框架的能力;利用山西省2015年慢病调查数据,分别采用MMHC算法和IPCB算法建立尿酸及其相关因素的贝叶斯网络结构,从实例上再次验证IPCB算法可以充分利用连续变量数据提供的信息建立更完整的疾病相关因素的网络关系,可为慢性病影响因素网络分析提供新的思路。方法:在GeNIe2.4中选取测试网络,生成不同样本量的连续数据集和离散数据集,分别利用IPCB算法和MMHC算法进行贝叶斯网络结构学习,与原始网络结构比较,以错误边数作为比较算法性能的指标。利用山西省2015年慢性病与营养监测数据,选取可能与尿酸相关的连续变量构成的数据集进行分析,根据研究内容分为代谢指标数据集和膳调户指标数据集。首先对两个数据集进行简单的统计描述,然后在两个数据集中采用IPCB算法建立尿酸相关因素的连续变量贝叶斯网络,同时将变量离散化后采用MMHC算法建立相应的离散贝叶斯网络,并与连续贝叶斯网络做比较,比较两种算法建立的尿酸相关因素贝叶斯网络的合理性。结果:(1)通过ASIA和TANK两个仿真网络测试研究发现,基于变量离散化的MMHC算法学习贝叶斯网络可以获得一部分正确的边,但不论样本量大小,丢失边的情况都比较突出。而IPCB连续结构学习算法在测试中发现,不论样本量大小,IPCB算法均能获得正确完整的网络结构。(2)从2015年山西省慢性病与营养监测数据库中提取与尿酸相关的连续变量指标,根据研究内容将数据库分为代谢指标数据集和膳调户数据集两个数据集分析。代谢指标数据集选取尿酸、甘油三酯、总胆固醇、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇、空腹血糖、糖化血红蛋白和年龄共8个连续变量指标;膳调户数据集选取与尿酸相关的身体测量和饮食指标:舒张压、收缩压、BMI、腰围、肉类摄入量、水产品摄入量、食盐摄入量、食用油摄入量、酒精摄入量、蔬果摄入量,共11个连续变量指标。两个数据集所选取的指标均不服从正态分布。(3)IPCB算法在两个数据集上建立的连续贝叶斯网络均较MMHC算法所建立的离散贝叶斯网络完整,能发现更多与尿酸相关的指标。代谢指标数据集中,MMHC算法建立的离散贝叶斯网络发现9条边,其中仅发现甘油三酯与尿酸的直接关系;IPCB算法建立的连续贝叶斯网络发现13条边,其中发现年龄、甘油三酯、高密度脂蛋白、低密度脂蛋白4个指标与尿酸的关系。膳调户数据集中,离散贝叶斯网络共学习到9条边,其中仅发现BMI一个指标与尿酸直接相关,未发现饮食习惯指标与尿酸的关系;连续贝叶斯网络学习到14条边,发现了尿酸与BMI及肉类、食用油、食用盐和蔬果摄入量的直接关联。结论(1)模拟试验表明,IPCB算法能充分用数据提供的信息,构建连续贝叶斯网络框架的性能优于MMHC算法。(2)IPCB算法建立的尿酸相关因素贝叶斯网络发现,与尿酸直接相关的指标为年龄、甘油三酯、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇、BMI、肉类食用量、蔬果摄入量、食用盐和食用油的摄入。相比于MMHC离散贝叶斯网络结构学习算法,IPCB算法学习到的网络关系更完整。(3)IPCB算法能有效地处理连续变量,在尿酸相关因素的研究中获得较满意的结果,可为慢性病相关因素的研究提供新的思路。
【学位单位】:山西医科大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:R195;TP311.13
【部分图文】:

概率分布,变量,情况,条件独立


山西医科大学硕士学位论文71.1.4条件独立设随机变量X,Y和Z,x,y和z分别是三个随机变量的任意取值,如果满足下列条件:(|=,=)=(|=)且(=,=)>0(1-3)则在给定Z时,称X和Y相互条件独立,用(,|)表示。即在已知Z的条件下,Y的取值不会影响X的概率分布。1.1.5d-分隔在贝叶斯网络中,d-分隔也叫有向分隔,对应于概率的条件独立。贝叶斯网络存在三种特殊的节点连接:顺连(头对尾)、分连(尾对尾)和汇连(头对头、碰撞V结构)。图1-1。图1-1变量X和Y通过Z间接相连的情况设Z为某节点集合,X和Y是不在Z中的两个节点,考虑X和Y之间的一条通路a,如果满足下面条件之一,则称a被Z所阻塞:(1)通路a上有一个顺连节点在Z中;(2)通路a上有一个分连节点在Z中;(3)通路a上有一个汇连节点W,它和它的后代节点均不在Z中.上述3种情况如图1-2所示.

算法,数据集中,样本,样本量


山西医科大学硕士学位论文162.2测试结果与分析(1)ASIA网络测试:ASIA原始网络结构如图2-1。图2-1Asia原始网络执行算法后发现,IPCB算法在Asia网络的不同样本数据集中均能获取与原网络一致的网络。而MMHC算法获取的网络存在不同程度的错误数,不能获得与原网络一致的网络;图2为样本量为500时MMHC算法得到的网络,获得的4条边均正确,但缺失了4条边,结构错误数为4;图3,样本量为1000/2000/10000时得到的网络结构一致,得到的5条边均正确,缺失3条边,结构错误数为3;样本量为5000时,获得的6条边均正确,缺失2条边,结构错误数为2。结果见表1,可见在节点数较少,网络较为稀疏时,MMHC可以学习到正确的边,无错误定向的边,但缺失边情况比较明显。见图2-2、2-3、2-4和表2-1。图2-2Asia-500-MMHC

算法,样本量


Asia-5000-MMHC表2.1Asia网络不同样本量IPCB与MMHC算法的结构错误
【相似文献】

相关期刊论文 前10条

1 贺继东;;基于贝叶斯网络的大学生就业协助系统[J];宁夏师范学院学报;2019年01期

2 张月;黄钢;章小雷;田理政;曾词正;;贝叶斯网络在医学领域中的应用研究[J];中国医学创新;2013年04期

3 赵越;茹婷婷;;贝叶斯网络结构学习方法新探[J];长春大学学报;2011年06期

4 李甦;陈新亿;李娟;李斯娜;;贝叶斯网的学习与应用研究综述[J];云南大学学报(自然科学版);2009年S1期

5 王双成;冷翠平;杜瑞杰;;一种新的贝叶斯网络增量学习方法[J];系统仿真学报;2009年17期

6 马壮,杨善林,胡小建;贝叶斯网结构学习的研究现状及发展趋势[J];合肥工业大学学报(自然科学版);2005年08期

7 刘明辉;王磊;党林阁;石景岚;;非确定先验信息的贝叶斯网结构学习方法[J];计算机工程;2010年05期

8 王磊;刘明辉;王维平;;先验信息不确定条件下贝叶斯网结构学习方法[J];计算机工程与应用;2010年16期

9 贾海洋;陈娟;刘大有;;贝叶斯网结构学习搜索空间分析[J];计算机工程与科学;2010年09期

10 曹凯峰;丁洪涛;;基于贝叶斯网络方法的客户忠诚研究[J];价值工程;2009年03期


相关博士学位论文 前10条

1 朱允刚;贝叶斯网学习中若干问题研究及其在信息融合中的应用[D];吉林大学;2012年

2 胡笑旋;贝叶斯网建模技术及其在决策中的应用[D];合肥工业大学;2006年

3 张少中;基于贝叶斯网络的知识发现与决策应用研究[D];大连理工大学;2003年

4 董立岩;贝叶斯网络应用基础研究[D];吉林大学;2007年

5 马德仲;基于贝叶斯网络和多源信息构建可靠性分析模型方法研究[D];哈尔滨理工大学;2015年

6 范敏;基于贝叶斯网络的学习与决策方法研究及应用[D];重庆大学;2008年

7 黄友平;贝叶斯网络研究[D];中国科学院研究生院(计算技术研究所);2005年

8 贾海洋;贝叶斯网学习若干问题研究[D];吉林大学;2008年

9 李小琳;面向智能数据处理的贝叶斯网络研究与应用[D];吉林大学;2005年

10 王红梅;保护隐私的贝叶斯网络学习研究[D];天津大学;2006年


相关硕士学位论文 前10条

1 宋伟梅;基于连续贝叶斯网络的尿酸相关因素应用研究[D];山西医科大学;2020年

2 辛国福;贝叶斯网络中的因果推断[D];西安电子科技大学;2011年

3 葛燕;人机结合的贝叶斯网建模方法研究[D];西安理工大学;2009年

4 郭艳军;贝叶斯网学习方法及应用研究[D];华中科技大学;2009年

5 张剑飞;贝叶斯网络学习方法和算法研究[D];东北师范大学;2005年

6 胡良东;共识贝叶斯网络研究及应用[D];吉林大学;2013年

7 王军;贝叶斯网络在认知诊断中的应用[D];南京师范大学;2012年

8 董晨;贝叶斯网络在电力系统故障中的应用研究[D];沈阳工业大学;2010年

9 周青松;贝叶斯网在图书馆图书采购中的应用[D];云南大学;2012年

10 高倩;基于贝叶斯网络预测的故障诊断的应用与研究[D];华北电力大学(北京);2011年



本文编号:2865143

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/mpalunwen/2865143.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户28150***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com