基于置信传播和依赖协变量的网络社区发现方法
本文选题:网络社区发现 + 随机分块模型 ; 参考:《东北师范大学》2017年硕士论文
【摘要】:网络在我们的生活中随处可见,很多系统都可以用网络来刻画,比如社会网络,生物网络,通信网络等等。随着以互联网为代表的网络信息技术的迅速发展,人类的生活与生产活动越来越多地依赖于各种网络。我们急需深入地挖掘网络,对网络数据进行深度分析来解决现实网络问题。而网络社区发现就是网络数据挖掘的一个重要课题,网络社区发现方法就是把网络中相似节点分为一个集合,称之为社区,使得社区内节点间的连接更为稠密,而不在一个社区的节点之间的连接极为稀疏。我们试图通过网络的连接情况以及各种节点的信息来发现这个网络里的社区分类情况,网络社区发现的成功将会使网络更加明晰也更加富有解释性,同时其社区发现会给现实网络带来很多的后续开发价值,比如精准营销等等。随着大数据时代的蓬勃发展,人们对于网络社区发现方法的要求越来越高,许多相关学者都致力于研究更为高效更为精确更有实际价值的网络社区发现方法。本文在传统的随机分块模型中引入了协变量信息,也就是说要通过网络和网络中节点的协变量共同来发现社区,这也更符合现实事实与实际需求。本文通过对随机分块模型社区发现的两种方法的等价性证明,来肯定了置信度传播思想在网络社区发现里的可行性,于是对于这样一个依赖于协变量的网络社区发现模型,在大型稀疏网络环境里,我们采用置信传播方法来完成参数估计。由于置信传播方法在带环的网络结构中并没有合理的解释性,所以鲜少被应用于网络社区发现领域,然而对于大型稀疏网络,我们更关心的是在复杂度低、操作简易的前提下的模型精确度,通过文章的生成模型实验以及基金委统计学关键词网络的实验结果我们也可以看到,推广到所建模型的置信传播算法比传统的EM算法还有谱方法等更为迅速,结果也同样极为精确。
[Abstract]:Network can be seen everywhere in our life, many systems can be described by network, such as social network, biological network, communication network and so on. With the rapid development of network information technology represented by the Internet, human life and production activities depend more and more on various networks. We need to dig into the network and analyze the network data to solve the real network problem. The discovery of network community is an important subject of network data mining. The method of network community discovery is to divide the similar nodes in the network into a set, which is called community, which makes the connection between nodes in the community more dense. Connections between nodes not in a community are extremely sparse. We try to find out the classification of the communities in the network through the connection of the network and the information of the various nodes. The success of the discovery of the network will make the network clearer and more explanatory. At the same time, its community discovery will bring a lot of future development value to the real network, such as precision marketing and so on. With the rapid development of the big data era, people are demanding more and more online community discovery methods. Many related scholars are devoted to the research of more efficient, more accurate and more practical online community discovery methods. In this paper, covariable information is introduced into the traditional random block model, that is to say, it is necessary to discover the community through the covariables of the network and the nodes in the network, which is also more in line with the reality and the actual demand. In this paper, we prove the equivalence of the two methods of community discovery in random block model, and confirm the feasibility of confidence propagation in the discovery of network community, so for such a covariable-dependent network community discovery model, In the large sparse network environment, we use confidence propagation method to complete the parameter estimation. Because the confidence propagation method has no reasonable explanation in the ring network structure, it is rarely used in the field of network community discovery. However, for large sparse networks, we are more concerned about the low complexity. The accuracy of the model under the premise of simple operation, we can also see the results of the model experiment and the experimental results of the CSC statistical keyword network. The confidence propagation algorithm extended to the established model is more rapid than the traditional EM algorithm and spectral method, and the results are also extremely accurate.
【学位授予单位】:东北师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:C81
【相似文献】
相关期刊论文 前3条
1 李莹;王仲君;赵华玲;;基于贝叶斯推断的HIV非线性混合效应联合模型研究[J];统计研究;2012年07期
2 张力为;研究问题与统计方法的有机配合[J];天津体育学院学报;2001年02期
3 袁媛;;基于观测方差的加权Stein估计[J];嘉兴学院学报;2007年06期
相关会议论文 前2条
1 侯艳;李康;;非劣效性临床试验中两组率差值的协变量调整方法[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
2 李广文;酆广增;;基于置信传播和波束搜索的LDPC联合译码算法[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
相关博士学位论文 前4条
1 王逸飞;考虑协变量影响的电力系统检修停运计划研究[D];浙江大学;2016年
2 马云艳;相依数据下协变量调整回归模型及其在金融时间序列中的应用[D];山东大学;2012年
3 张新佶;生存资料非劣效性评价的非参数协方差模型研究及实现[D];第二军医大学;2012年
4 吴远山;辅助数据问题和多元失效时间的半参数分析[D];武汉大学;2010年
相关硕士学位论文 前10条
1 何佳谦;基于置信传播和依赖协变量的网络社区发现方法[D];东北师范大学;2017年
2 谢骁;基于纵向协变量的Cox模型及其在疗效评估中的应用[D];云南师范大学;2015年
3 崔剑岚;应用多结局生存分析模型评价随时间变化的协变量对胃癌患者预后的影响[D];复旦大学;2014年
4 程文帅;非小细胞肺癌患者生存分析建模研究[D];北京工业大学;2015年
5 周多;生态数据和含协变量样本数据的联合分析[D];东北师范大学;2009年
6 张鹏程;有缺失协变量的相对危险率模型的估计理论及其渐近性质[D];清华大学;2010年
7 陈淑英;线性协变量调整模型的参数估计[D];浙江大学;2008年
8 马燕;高斯图模型的结构学习及应用[D];西北大学;2017年
9 刘欣;高维面板数据模型中协变量选择和异方差检验[D];云南财经大学;2014年
10 王宇达;因果效应和统计推断[D];北京邮电大学;2015年
,本文编号:2118432
本文链接:https://www.wllwen.com/shekelunwen/shgj/2118432.html