基于分层贝叶斯网络的医务人员健康风险评估研究

发布时间：2021-08-17 04:21

　　健康体检数据是健康医疗大数据中最主要的数据来源和数据类型之一。在大数据时代到来的今天,医疗系统中已经积累了大量的各行业体检记录,通过体检数据进行健康风险评估以提供健康管理方案具有重要意义。本文探讨的对体检记录数据的分析方法将为健康管理提供更精准的依据。为了评估体检者的健康风险并提供健康管理方案,常用的方法是基于概率估计的风险度量方法,即根据体检者已知的个人信息推断各体检项目的异常概率。贝叶斯网络作为一种概率图模型,可以基于健康体检数据来训练发掘不同信息变量间的关联关系并进行后验概率推断,因此本文基于贝叶斯网络模型来评估体检者的健康风险。本文将刻画体检记录数据的的贝叶斯网络划分为“基本信息层”及“体检项目层”两个层次,并设计了一种由含有缺失值的体检数据驱动的带约束分层贝叶斯网络结构学习方法:首先基于半朴素贝叶斯算法（TAN）学习基本信息层内部的连接,并限制层间连接的方向（称为“分层TAN型约束”）;然后采用集成方法（Bagging）学习网络整体结构（包含体检项目层内部连接及两层间连接）,即采用自助采样获得结点连接的置信度,其中基学习算法为结构EM算法;为了进一步提高模型的泛化能力,在Ba...

【文章来源】：山东大学山东省 211工程院校 985工程院校教育部直属院校

【文章页数】：70 页

【学位级别】：硕士

【部分图文】：

图２．２：?“尾到尾”形态图，又称为“同父结构”（ｃｏｍｍｏｎ?ｐａｒｅｎｔ）

形态图,顺序结构,形态图,条件独立

?山东大学硕士学位论文???这将带来Ｘ与Ｆ的条件独立性：??Ｐ｛Ｘ，Ｙ＼Ｚ）＝?＝?Ｐ（Ｘ?＼?Ｚ）Ｐ｛Ｙ?＼?Ｚ）．?（２．１１）??＆￣￣？￣￣＜Ｅ）??图２．２：?“尾到尾”形态图，又称为“同父结构”（ｃｏｍｍｏｎ?ｐａｒｅｎｔ）。以变量Ｚ??为条件，Ｘ与：Ｋ此时是条件独立的。??（２）?“头到尾”形态见图２．３，?Ｘ，Ｚ，Ｙ按照顺序依次排列，这个图的联合概率密??度表示为??Ｐ（Ｘ，?Ｙ，?Ｚ）?＝?Ｐ｛Ｘ）Ｐ｛Ｚ?｜?Ｘ）Ｐ（Ｙ?｜?Ｚ）．?（２．１２）??此时会发现当Ｚ为已知条件时，Ｘ和Ｋ的相关性被切断：??，?７、?Ｐ（Ｘ，?Ｙ，?Ｚ）?Ｐ（Ｘ）Ｐ（Ｚ?｜?Ｘ）Ｐ（Ｙ?｜?Ｚ）??Ｐ（Ｘ，Ｙ＼Ｚ）＝?ｐ｛ｚ）?＝?Ｗ）???＝Ｐ（Ｙ?１?Ｚ）?＝?Ｐ（Ｘ?１?Ｚ）Ｐ（Ｆ?１?Ｚ）．?（２．１３）??？￣￣＜￡）￣￣＜ｒ）??图２．３：?“头到尾”形态图，又称为“顺序结构”。以变量Ｚ为条件，Ｘ与ｙ??此时也是条件独立的。这说明Ｚ的存在并没有沿着连接方向将依赖性由Ｘ??传递向ｙ，反而将依赖性切断。??（３）?“头到头”形态见图２．４，?Ｚ是Ｘ，ｙ共同的子结点。这个图的联合概率密度??也容易写出：??Ｐ（Ｘ，?ｙ，?Ｚ）?＝?Ｐ（Ｘ）Ｐ（Ｙ）Ｐ（Ｚ?Ｉ?Ｘ，?Ｙ）．?（２．１４）??然而，将此代入尸（Ｘ，ｙ?Ｉ?ｚ）中不再能得到条件独立性定义，因此这种形态??下一般不能推出条件独立。虽然Ｘ和ｙ这时显然是（无条件）独立的，但??在以Ｚ为条件时非条件独立。??如果拓展到任意一个有向无环图，联合概率分布的条件独立性可以由ｄ－划??分（ｄ－ｓｅｐａｒａｔｉｏｎ）直接判断，其中ｄ表示有向（ｄｉｒｅｃ

形态图,形态图,变量,条件

?山东大学硕士学位论文???？￣￣＜￡＞￣￣？??图２．４：?“头到头”形态图，以己知的变量值ｚ为条件时，文中己显示ｘ与ｙ??并不是条件独立的。然而，如果不考虑结点ｚ时，ｘ与ｙ是独立的，因为根??据式（２．１４）可知?ｐ（ｘ，ｙ）?＝?＝??Ｐ（Ｘ）Ｐ（Ｙ）〇??连接路径是否被某些结点所阻隔（ｂｌｏｃｋｅｄ）。ｄ－划分的具体描述可参考Ｂｉｓｈｏｐ＾３］??（２００６）〇??２．２．２结构学习??贝叶斯网络的结构学习是从给定的数据集中挖掘合理的贝叶斯网络拓扑结??构的过程。通常有两类结构学习方法：“基于约束”（ｃｏｎｓｔｒａｉｎｔ－ｂａｓｅｄ）的方法和??“基于评分”（ｓｃｏｒｅ－ｂａｓｅｄ）的方法。??“基于约束”方法筛查变量间的条件独立性并直接汇总成为完整网络，例如??ＴＡＮ构建时使用条件互信息判定。常用的算法有ＳＧＳ算法（Ｓｐｉｒｔｅｓ?ｅｔ?ａｌ．＿，??２０００）、ＰＣ算法（Ｓｐｉｒｔｅｓ?＆?Ｍｅｅｋ！３３］，?１９９５）等。这种方法高度依赖于单次条件独??立性检验的结果，即如果其中某个检验给出了有偏差的结果，就可能会影响整??个贝叶斯网络的构建；同时这些检验通常只能关注局部信息，缺少对多变量相??关关系的处理能力，因而本文中仅将约束作为结构学习中的一个步骤。??本节中将重点介绍“基于评分”的方法。该方法设计评分函数（ｓｃｏｒｅ?ｆｕｎｃ？??ｔｉｏｎ）?来衡量网络结构拟合给定数据集的程度。网络结构空间是由各种不同的连??接组合构成，当构成网络的变量数量为Ｋ时，其数量级达到２Ｇ（Ｐ）。因此，在结构??空间中寻找最优网络是一个Ａ／＂Ｐ－难（Ａ＾Ｐ－ｈａｒｄ）问题（Ｃｈｉｃｋｅｒｉｎｇ间，１９９６）

本文编号：3347046

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/shoufeilunwen/mpalunwen/3347046.html

上一篇：易罐刮痧治疗小儿乳蛾（风热犯肺证）临床研究
下一篇：“双U”三步法胰肠吻合术的临床应用研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|