复杂网络模体挖掘算法研究
本文选题:复杂网络 + 网络模体 ; 参考:《昆明理工大学》2016年硕士论文
【摘要】:目前,复杂网络的研究一个热点。在生物信息学领域中,发现一个又一个非常有意义的结论。但它不仅仅在生物信息学领域中广泛应用,还应用在社会学,计算机网络,电子商务等等涉及到网络分析的领域中。有名的“啤酒尿不湿”故事,也是通过对商品销售网络中进行关联规则挖掘得出的。而网络模体又是复杂网络信息挖掘中的一个重要信息之一。因为它能够反映出社区团体的规模及效能。面对动态网络的网络模体挖掘这一问题,本文首先用抽象化,形式化的数学语言来表述该问题。其次,本文分析研究了传统动态网络的网络模体挖掘算法,研究其运行效率,并得出其算法效率低的原因。再提出一种新的高效的动态网络的网络模体挖掘算法。并且提出三个性质从理论上来保证本文所提出的动态网络模体挖掘算法的正确性。再次,根据本文提出的三个性质,设计实现了动态网络模体挖掘新算法。在算法设计中,记录用时间权重信息来描述满足网络模体条件的子图的拓扑结构,和满足网络模体条件的子图的顶点信息,以此来保证网络模体挖掘的完整性。并从理论上分析本文提出的新算法与传统算法的时间复杂度,表明新算法比传统算法效率要高很多。再次,本文通过对于动态网络与静态网络的对比分析得出,静态网络是动态网络的一种特殊情况。从而将动态网络与静态网络的网络模体挖掘建立统一关系。同时还分析得出,只需要将本文提出的动态网络模体挖掘算法做相应的修改就可以应用在静态网络的网络模体挖掘中。最后,通过各种实验来验证前面的结论,即新算法的效率高于传统算法的效率。为此设计了4种实验,分别是:度分布服从均匀分布的网络、度分布服从Poisson分布的网络、度分布服从Power-Law分布的网络以及二分图的网络。
[Abstract]:At present, the research of complex network is a hot spot.In the field of bioinformatics, one after another very meaningful conclusions have been found.But it is not only widely used in the field of bioinformatics, but also in the fields of sociology, computer network, electronic commerce and so on.The famous "Beer diaper" story is also derived by mining association rules in commodity sales networks.Network motif is one of the important information in complex network information mining.Because it reflects the size and effectiveness of community groups.Faced with the problem of dynamic network motif mining, this paper first uses abstract and formal mathematical language to express the problem.Secondly, this paper analyzes and studies the traditional dynamic network motif mining algorithm, studies its running efficiency, and obtains the reason of its low efficiency.A new and efficient algorithm for dynamic network motif mining is proposed.Three properties are proposed to ensure the correctness of the dynamic network motif mining algorithm proposed in this paper.Thirdly, according to the three properties proposed in this paper, a new dynamic network motif mining algorithm is designed and implemented.In the algorithm design, time weight information is used to describe the topological structure of the subgraph satisfying the network motif condition and the vertex information of the subgraph satisfying the network motif condition to ensure the integrity of the network motif mining.The time complexity of the new algorithm and the traditional algorithm is analyzed theoretically, which shows that the new algorithm is much more efficient than the traditional algorithm.Thirdly, through the comparative analysis of dynamic network and static network, it is concluded that static network is a special case of dynamic network.In order to establish a unified relationship between dynamic network and static network network motif mining.At the same time, it is concluded that the dynamic network motif mining algorithm proposed in this paper can be applied to static network motif mining only by modifying it.Finally, experiments are conducted to verify the conclusion that the efficiency of the new algorithm is higher than that of the traditional algorithm.Four kinds of experiments are designed for this purpose: the degree distribution follows the uniform distribution network, the degree distribution service follows the Poisson distribution network, the degree distribution service follows the Power-Law distribution network and the bipartite graph network.
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;O157.5
【相似文献】
相关期刊论文 前10条
1 王春连;胡秀珍;;用二次判别方法识别蛋白质β-发夹模体[J];生物物理学报;2009年04期
2 李慧敏;胡俊;张静;;果蝇核糖体蛋白基因中潜在转录协同作用模体的统计分析[J];云南大学学报(自然科学版);2010年03期
3 胡秀珍;李前忠;;矩阵打分的方法应用于蛋白质β-发夹模体的识别[J];内蒙古大学学报(自然科学版);2007年06期
4 姜雪;胡秀珍;;打分矩阵方法在β-发夹模体识别中的应用[J];生物信息学;2008年04期
5 岳俊杰;谭明峰;周围;王夏;李北平;王月兰;梁龙;;细菌黏附素序列模体分析[J];生物技术通讯;2008年05期
6 姜雪;;蛋白质βαβ模体序列的统计分析及其识别[J];昆明理工大学学报(理工版);2010年05期
7 贾少春;胡秀珍;;基于添加功能位点信息的组合向量预测β-发夹模体[J];内蒙古工业大学学报(自然科学版);2012年03期
8 陈丹;梁振霞;李慧敏;;组合调控中过表达模体对距离的统计检验[J];基因组学与应用生物学;2013年01期
9 宋航宇;胡秀珍;冯振兴;姜卓;孙利霞;;基于统计特征的酶蛋白质中特殊模体βαβ的预测[J];生物物理学报;2013年09期
10 叶玉珍,解涛,丁达夫;蛋白质功能基团三维模体及其应用[J];科学通报;2000年12期
相关会议论文 前4条
1 李彩艳;胡秀珍;;蛋白质中两种Strand-Loop-Strand模体的判断[A];第十次中国生物物理学术大会论文摘要集[C];2006年
2 高燕莉;张镭;李剑颖;;应用64排CT优化高分辨CT扫描方案的模体研究[A];中华医学会第十三届全国放射学大会论文汇编(下册)[C];2006年
3 李兴东;万国庆;田中青;;X射线CT检测标准的研究[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(下册)[C];2002年
4 安晶刚;;PET质量检测的方法及相应模体[A];全国医用辐射防护与安全学术研讨会论文汇编[C];2004年
相关博士学位论文 前8条
1 于强;生物序列模体发现算法研究[D];西安电子科技大学;2014年
2 刘丙强;原核生物中的转录调控模体预测研究[D];山东大学;2010年
3 刘倩;基于贝叶斯统计的基因非编码区与模体识别问题研究[D];西安电子科技大学;2014年
4 周川;原核生物调控模体和调节子预测算法研究[D];山东大学;2014年
5 周鹏;生物非键模体[D];浙江大学;2011年
6 张凌慧;基因组中顺式调控模体的特征分析与计算预测[D];中国协和医科大学;2005年
7 刘立芳;生物信息学中的多序列比对与模体识别问题研究[D];西安电子科技大学;2006年
8 张懿璞;转录因子结合位点识别问题的算法研究[D];西安电子科技大学;2014年
相关硕士学位论文 前10条
1 周燕;SRK-ARC1识别模体序列多态性与甘蓝亲和指数的相关性研究[D];西南大学;2015年
2 马平;基因组序列8-mer模体使用分离与不同序列组成和物种进化的关系[D];内蒙古大学;2015年
3 刘国君;酵母基因组8-mer模体使用的进化分离与功能分析[D];内蒙古大学;2015年
4 王晶;ChIP-Seq中DNA模体挖掘工具的比较[D];苏州大学;2015年
5 苏润梅;DNA序列中模体识别算法研究[D];电子科技大学;2014年
6 申军军;复杂超声模体快速制造及其B超成像[D];石家庄铁道大学;2015年
7 方慧婷;任务驱动社会网络的模体分析与研究[D];浙江工业大学;2015年
8 李俊;基于MapReduce的软件网络模体查找算法研究[D];东北大学;2014年
9 杨志枫;原核生物调控模体预测与分析[D];山东大学;2016年
10 唐华阳;复杂网络模体挖掘算法研究[D];昆明理工大学;2016年
,本文编号:1752588
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1752588.html