基于自助法的贝叶斯网结构学习
发布时间:2021-08-12 22:16
贝叶斯网是描述随机变量间关系的一种模型,它以有向无圈图(DAG)表示随机变量的条件独立关系,以条件概率表示随机变量依赖关系的强度。目前,贝叶斯网被广泛地应用于因果推断、机器学习、心理学等领域。研究贝叶斯网的非常重要的问题之一是结构学习,也就是从观测数据出发探求变量间的条件独立关系。本文基于自助法给出高斯贝叶斯网的结构学习算法。该算法第一步,先得到B个Bootstrap样本;第二步,利用结构学习算法得到B个DAG,并求得B个DAG对应贝叶斯网的极大似然估计;第三步,搜索一个DAG,使其对应的贝叶斯网的极大似然估计,与B个极大似然估计平均的惩罚Kullback-Leibler(KL)距离最近。其中在第三步,我们以B个DAG中出现的边作为候选边搜索DAG,这样可以大大提高搜索的速度。本文通过模拟实验发现,自助法可以大大提高结构学习的效果。我们与PC算法、GES算法、GDS算法、GDSM算法进行了比较分析,模拟结果显示自助法表现最好。我们分析了39个基因的表达数据,探索了基因之间的关系。
【文章来源】:长春工业大学吉林省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
2,3是三个等价的DAG再来看一个例子
第4章模拟实验24采用ges算法还是采用pc算法,对于阈值f的不同取值和两种初值方式,得到的CPDAG的结构海明距离和DAG的结构海明距离均明显小于ges和pc的结构海明距离。并且阈值f较小时,与真实图的结构海明距离也较小,例如gesb10、gesbR10和pcb10、pcbR10。对于两种初值方式,随机DAG的初值,对f的选取依赖更小一些。图4.1a=20,=100时24种算法的箱线图(CPDAG)图4.1b=20,=100时24种算法的箱线图(DAG)
第4章模拟实验24采用ges算法还是采用pc算法,对于阈值f的不同取值和两种初值方式,得到的CPDAG的结构海明距离和DAG的结构海明距离均明显小于ges和pc的结构海明距离。并且阈值f较小时,与真实图的结构海明距离也较小,例如gesb10、gesbR10和pcb10、pcbR10。对于两种初值方式,随机DAG的初值,对f的选取依赖更小一些。图4.1a=20,=100时24种算法的箱线图(CPDAG)图4.1b=20,=100时24种算法的箱线图(DAG)
【参考文献】:
期刊论文
[1]基于bootstrap方法的贝叶斯网络结构学习算法在构建基因调控网络中的应用[J]. 李海龙,侯艳,柯朝甫,李康. 中国卫生统计. 2015(02)
硕士论文
[1]基于重抽样方法的含缺失数据图模型的模型选择[D]. 秦铭.长春工业大学 2019
本文编号:3339176
【文章来源】:长春工业大学吉林省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
2,3是三个等价的DAG再来看一个例子
第4章模拟实验24采用ges算法还是采用pc算法,对于阈值f的不同取值和两种初值方式,得到的CPDAG的结构海明距离和DAG的结构海明距离均明显小于ges和pc的结构海明距离。并且阈值f较小时,与真实图的结构海明距离也较小,例如gesb10、gesbR10和pcb10、pcbR10。对于两种初值方式,随机DAG的初值,对f的选取依赖更小一些。图4.1a=20,=100时24种算法的箱线图(CPDAG)图4.1b=20,=100时24种算法的箱线图(DAG)
第4章模拟实验24采用ges算法还是采用pc算法,对于阈值f的不同取值和两种初值方式,得到的CPDAG的结构海明距离和DAG的结构海明距离均明显小于ges和pc的结构海明距离。并且阈值f较小时,与真实图的结构海明距离也较小,例如gesb10、gesbR10和pcb10、pcbR10。对于两种初值方式,随机DAG的初值,对f的选取依赖更小一些。图4.1a=20,=100时24种算法的箱线图(CPDAG)图4.1b=20,=100时24种算法的箱线图(DAG)
【参考文献】:
期刊论文
[1]基于bootstrap方法的贝叶斯网络结构学习算法在构建基因调控网络中的应用[J]. 李海龙,侯艳,柯朝甫,李康. 中国卫生统计. 2015(02)
硕士论文
[1]基于重抽样方法的含缺失数据图模型的模型选择[D]. 秦铭.长春工业大学 2019
本文编号:3339176
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3339176.html