当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于MMHC混合算法的贝叶斯网络在2型糖尿病影响因素研究的应用

发布时间:2020-08-14 07:11
【摘要】:目的:研究贝叶斯网络混合结构学习算法——MMHC算法,并与禁忌搜索算法比较,探索该算法构建贝叶斯网络模型效果;建立糖尿病影响因素的贝叶斯网络模型,研究这些可能因素与糖尿病之间的关系,通过贝叶斯网络推理反映这些影响因素对糖尿病的作用强度,并为其它慢性病影响因素发现提供合理的方法。方法:首先选择标准贝叶斯网络模型生成仿真数据,分别用禁忌搜索算法和MMHC混合算法建立贝叶斯网络模型,与原始模型比较,通过丢失边、多余边的数量及其之和评价两种方法建立的贝叶斯网络模型效果;然后利用2013年山西省慢性病及其危险因素监测数据,通过建立糖尿病的贝叶斯网络模型,探究糖尿病的影响因素,并与logistic回归模型进行比较。结果:(1)利用标准贝叶斯网络随机生成不同样本量的数据集,然后分别用禁忌搜索算法和MMHC混合算法构建贝叶斯网络模型,结果发现无论节点数多少,数据样本量越大,所构建的贝叶斯网络结构与标准网络一致性越高。当网络中节点较少时,无论样本量多少,两种算法构建贝叶斯网络效果差别不大;对于节点较多的情况,样本量较小时,两种算法学习效果一致,样本量较大时,MMHC混合算法构建贝叶斯网络优于禁忌搜索算法。(2)将糖尿病的相关因素进行单因素分析,将P0.05的变量进行多因素logistic回归分析,并建立贝叶斯网络结构。logistic回归结果显示最终进入回归模型的因素有年龄、地区、婚姻状况、医疗保险、BMI分组、中心性肥胖、高血压、高血脂和被动吸烟;其中高血压、高血脂、中心性肥胖是糖尿病的主要危险因素,患糖尿病的风险分别提高86.7%、44.8%、26.9%。而构建的贝叶斯网络提示,高血压和高血脂可能直接影响着糖尿病的发生;而年龄、中心性肥胖和BMI可能直接与高血压的发生有关,进而间接影响了糖尿病的发生;城乡高血脂检出率不同,间接影响糖尿病患病水平。其余变量间存在相关性,但与糖尿病的网络关系相隔较远。进行贝叶斯推理,对于未患有高血压和高血脂的人,患糖尿病的可能性降为0.104,若只患有高血压,患糖尿病的概率为0.176,若只患有高血脂,患糖尿病的概率为0.133,当同时患有高血压和高血脂时,患糖尿病的概率为0.272。与logistic回归相比,贝叶斯网络中各因素通过复杂的拓扑结构与糖尿病建立联系更能反映影响因素间及因素与疾病间复杂的关系,表达更准确和直观。结论:(1)对于节点数较多的网络,样本量较大时,MMHC算法搜索效果优于禁忌搜索算法;节点数较少的网络,两种算法搜索性能相近。(2)将MMHC混合算法应用于贝叶斯网络建立糖尿病贝叶斯网络模型,提示高血压和高血脂可能直接影响着糖尿病的发生,其余变量间接影响糖尿病的发生。通过网络拓扑结构发现影响因素与疾病间复杂的关系,同时发现各影响因素间依赖关系,为糖尿病影响因素发现提供合理的方法,能更好的对糖尿病进行预防。
【学位授予单位】:山西医科大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R587.1
【图文】:

贝叶斯网络,示例,参数学习


图 1-1 贝叶斯网络结构示例1.3 贝叶斯网络学习贝叶斯网络学习指的是通过分析先验信息和样本数据而得到完整的贝叶斯拓扑结构,包括参数学习和结构学习两种情况[40-41]。1.3.1 贝叶斯网络参数学习参数学习是在已知网络结构 G 和训练样本集 D 的情况下,利用先验信息来贝叶斯网络的参数,即网络中各节点处的条件概率密度[42]。对于完备据集来讲,常用的参数学习方法有极大似然估计和贝叶斯估计。1.3.1.1 极大似然估计[43]

网络结构图,贝叶斯网络,资源库,有向边


MMHC 算法是结合了条件独立性测试和评分搜索的混合算法。本课题组已证实搜索算法构建的贝叶斯网络模型拟合效果较好。本章从贝叶斯网络资源库中选择贝叶斯网络,生成不同样本量仿真数据,分别用禁忌搜索算法和 MMHC 算法进叶斯网络结构学习,并评价模型效果。3.1 资料与方法3.1.1 数据与资料从贝叶斯网络资源库中选取两个网络作为评价算法有效性的基准实验网络网络、Car Diagnosis 网络。Asia 网络又叫 Chest Clinic 网络,它是一个应用于医统的肺部疾病诊断网络。主要通过病人的行为、症状和检查结果来判断其是否图 3-1 是该网络的标准结构,包括 8 个节点和 8 条有向边。Car Diagnosis 网络是用于汽车故障诊断的网络,包含 20 个节点和 22 条有向边,如图 3-2 所示。

网络结构图,贝叶斯网络,样本量,禁忌搜索算法


图 3-2 Car Diagnosis 网络结构图3.1.2 分析方法利用 Asia 和 Car Diagnosis 贝叶斯网络随机生成不同样本量的数据集,分别用禁忌搜索算法和 MMHC 算法进行贝叶斯网络结构学习。从数据集中学习的贝叶斯网络结构与原始网络比较,丢失边 M (E)、多余边 A (E)的数量及其之和 S(E),作为评价指标评价算法的准确性。本文禁忌搜索算法、MMHC 算法分别使用 R3.1.2 软件中的贝叶斯网络学习程序包进行学习。3.2 结果与分析表 3-1 展示了不同样本量下 Asia 网络的学习效果,可以看出,数据样本量越大,两种算法确定的贝叶斯网络结构越准确。样本量为 50 时,两种算法没有发现网络中

【参考文献】

相关期刊论文 前10条

1 魏珍;张雪雷;饶华祥;王华芳;王祥;仇丽霞;;禁忌搜索算法的贝叶斯网络模型在冠心病影响因素分析中的应用[J];中华流行病学杂志;2016年06期

2 陈梦洁;万源;吴克风;童恒庆;;混合鱼群优化算法的贝叶斯网络结构学习[J];河南科技大学学报(自然科学版);2016年04期

3 赵振华;童亚慧;杨青敏;;国内外糖尿病自我管理的研究与进展[J];上海护理;2015年04期

4 汪春峰;蒋妍;;基于蜂群算法和遗传算法的贝叶斯网络结构混合学习方法[J];河南师范大学学报(自然科学版);2015年04期

5 李硕豪;张军;;贝叶斯网络结构学习综述[J];计算机应用研究;2015年03期

6 郭童;林峰;;基于混合差分蜂群算法的贝叶斯网络结构学习[J];模式识别与人工智能;2014年06期

7 胡云安;刘振;宋瑞华;史建国;;爬山法与模式蚁群法混合的贝叶斯优化算法[J];华中科技大学学报(自然科学版);2013年05期

8 汪春峰;张永红;;基于无约束优化和遗传算法的贝叶斯网络结构学习方法[J];控制与决策;2013年04期

9 杨晓霞;杜毅;赵春玲;;社区高血压糖尿病患者及高危人群健康教育的必要性[J];内蒙古中医药;2013年08期

10 纪立农;胡善联;张丹仪;;以新的策略和管理方法挑战糖尿病给中国带来的巨大经济负担[J];中国医药科学;2013年01期

相关硕士学位论文 前10条

1 魏珍;基于贝叶斯网络在肝硬化并发肝性脑病相关因素及分类识别的应用研究[D];山西医科大学;2017年

2 张雪雷;基于禁忌搜索算法的贝叶斯网络在疾病预测与诊断中的应用[D];山西医科大学;2015年

3 李景囡;基于依赖分析的贝叶斯网络结构学习算法研究[D];西安电子科技大学;2014年

4 朱晓峰;贝叶斯网络及马尔科夫毯的学习算法研究[D];西安电子科技大学;2014年

5 蔡其亨;云闪雷电脉冲信号的到达时间差估计与软件实现[D];华中科技大学;2013年

6 沈佳杰;基于改进混合进化算法的贝叶斯网络结构学习[D];浙江大学;2013年

7 汪星;社区2型糖尿病患者自我管理行为干预方法的研究与应用[D];安徽医科大学;2012年

8 尹建杰;Logistic回归模型分析综述及应用研究[D];黑龙江大学;2011年

9 郑冬冬;基于贝叶斯网络的图像型垃圾邮件识别研究[D];江苏大学;2010年

10 葛燕;人机结合的贝叶斯网建模方法研究[D];西安理工大学;2009年



本文编号:2792692

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2792692.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e2470***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com