基于核独立成分分析的缺失数据下贝叶斯网络学习算法研究
本文关键词:基于核独立成分分析的缺失数据下贝叶斯网络学习算法研究
更多相关文章: 贝叶斯网络 缺失数据 核独立成分分析 不完全Cholesky分解
【摘要】:二十一世纪是数据和信息化的时代,各类数据库和信息系统的建立提高了人类分析数据并进行决策的能力。由于数据量的急速增加,如何从大规模数据中挖掘出数据所蕴含的信息成为了一项重要的研究课题。贝叶斯网络(Bayesian Networks, BN)是一种将概率论运用于不确定性推理的工具,它是概率统计与图论相结合的一种概率图模型(Probabilistic Graphical Models)。贝叶斯网络清晰地表达了各个节点之间的因果关系,能够利用现有数据分析不确定事件发生的概率。贝叶斯网络的一大优势是可以利用先验知识进行学习。在生物实验中,由于实验技术等原因会出现缺失数据,对缺失数据处理不当会影响数据分析的结论,最简单的方法是去掉具有缺失数据的样本,但这一方法会降低数据的信息量,有可能会造成重要结果的丢失。常用的不完整数据中网络结构学习的方法需要进行反复迭代计算,需要耗费较长的时间。本文首先介绍了贝叶斯理论和贝叶斯网络的研究背景,并对贝叶斯网络的基本定义和理论进行了分析介绍。本文基于核独立成分分析(Kernel independent component analysis, KICA)的思想以及矩阵的不完全Cholesky分解的算法设计了一种贝叶斯网络结构的评分函数,该函数能够在缺失数据下直接对网络结构进行评分而避免进行补齐缺失数据的相关步骤,从而提高了计算的效率以及学习结果的可靠性。在理论分析的基础上,本文实现了这种评分函数,编写了一个基于这一评分函数的贝叶斯网络结构学习算法,并在异质深度测序数据上进行了基因表达调控网络的构建。本文的程序在读取含有缺失数据的异质深度测序数据之后,能够直接利用该数据对网络结构进行评分,并且能够根据贝叶斯等价类理论以及生物调控网络的反馈现象将学习出的有向无环图(DAG)转换为部分有向无环图(PDAG)。最后将学习结果与标准网络结构进行比较,利用Jaccard相似度衡量本文学习的网络和标准网络的相似度,证明本文提出的算法的有效性。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18
【相似文献】
中国期刊全文数据库 前10条
1 邢婧;;缺失数据情形下谐波参数估计的研究现状[J];信息通信;2014年03期
2 沈奇;王池社;;生物缺失数据处理的贝叶斯模型研究[J];微电子学与计算机;2011年07期
3 刘星毅;曾春华;江南雨;陈振华;韦小玲;;缺失数据的处理和挑战[J];钦州学院学报;2008年06期
4 孙亚;;ITS采集交通信息缺失数据修复策略及模型研究[J];黑龙江科技信息;2013年15期
5 肖静;骆如九;宋雯;汤在祥;徐辰武;;带有缺失数据的一种动态聚类方法[J];中国农业科学;2012年21期
6 周秀梅;李作春;覃泽;;有序填充微阵列缺失数据[J];计算机工程与应用;2009年22期
7 张广兴;石治国;余宗敏;;基于B-样条自由节点的外测缺失数据重构方法[J];测控技术;2013年09期
8 郝胜轩;宋宏;周晓锋;;基于近邻噪声处理的KNN缺失数据填补算法[J];计算机仿真;2014年07期
9 冯志兰,刘桂芬,刘力生,郝建生;缺失数据的多重估算[J];中国卫生统计;2005年05期
10 黄华东;方小勇;陈政;洪俊;黄樱;;一种基于RBF的时序缺失数据修复方法[J];怀化学院学报;2013年05期
中国重要会议论文全文数据库 前8条
1 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 陈楠;刘红云;;基于增长模型的缺失数据处理方法之比较[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
4 肖进;贺昌政;;面向缺失数据的客户价值区分集成模型研究[A];中国企业运筹学[2010(1)][C];2010年
5 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年
6 孙玲;刘浩;袁长亮;;北京市城市快速路微波检测缺失数据分析[A];2008第四届中国智能交通年会论文集[C];2008年
7 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年
8 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
中国博士学位论文全文数据库 前9条
1 马友;基于QoS缺失数据预测的个性化Web服务推荐方法研究[D];北京邮电大学;2015年
2 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年
3 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年
4 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年
5 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年
6 赵鹏飞;混沌数据恢复与非线性系统的模型参考控制[D];吉林大学;2010年
7 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年
8 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年
9 付志慧;多维项目反应模型的参数估计[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨利华;缺失数据的处理方法研究及应用[D];景德镇陶瓷学院;2011年
2 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年
3 褚培肖;缺失数据下的有限混合计数数据模型的统计推断研究[D];昆明理工大学;2015年
4 申宁宁;纵向研究缺失数据多重填补及混合效应模型分析[D];山西医科大学;2015年
5 李少琼;纵向研究二分类缺失数据处理及加权估计方程的应用[D];山西医科大学;2015年
6 高宇钊;比值缺失数据的多重估算与心脏康复二级预防干预效果评价及应用[D];山西医科大学;2015年
7 李顺静;基于EM算法的缺失数据的统计分析及应用[D];重庆工商大学;2015年
8 汪静波;Logistic回归模型中缺失数据的处理[D];南京大学;2015年
9 朱建斐;数据集缺失数据恢复算法研究[D];西安电子科技大学;2015年
10 杨旭;多视角数据缺失补全问题研究[D];北京交通大学;2016年
,本文编号:1283064
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1283064.html