当前位置:主页 > 科技论文 > 数学论文 >

基于矩阵填充的链接预测算法研究

发布时间:2018-09-07 19:56
【摘要】:近年来,随着web2.0技术的迅猛发展,社会网络的规模也不断发展壮大,复杂网络分析对研究者们来说成为一项重要的研究任务。而链接预测问题作为复杂网络分析的一个研究分支,其在社会网络、生物信息网络、食物网等诸多与人类生活密切相关的方面都有着广泛的应用价值。因此,本文深入学习了链接预测问题。在数据挖掘领域,链接预测问题扮演着十分重要的角色,其目的是根据网络已知的各类信息估计两个不相连的节点存在链接的概率。链接预测作为数据挖掘领域的重要研究内容,已经被研究许多年了。它被分为两种类型:一预测未知链接;二预测未来链接。第一种致力于挖掘应该存在但未被人所知的链接,第二种致力于预测现有网络中不存在但未来可能发生的链接。本文主要集中于预测未知的链接。现存的链接预测算法大体分为四类:一基于拓扑结构的链接预测;二基于社会学理论的链接预测;三基于机器学习的链接预测;四基于矩阵分析的链接预测。本文就第一点和第四点展开了深入的研究。提出了以下几点创新点:1.本文针对基于拓扑结构的链接预测算法进行改进,将CN算法和RA算法结合在一起,提出一种新的相似度度量方法CN-RA。这种方法不仅考虑社会网络中共同邻居数目,还考虑了单个共同邻居节点对节点相似度的影响,同CN算法、RA算法和其它基准的基于拓扑结构的算法相比,取得了更好的预测效果。2.本文提出一种多特征融合的链接预测框架。受到已有的基于矩阵填充的链接预测方法的启发,我们深入研究了增广拉格朗日乘子算法-ALM。使用邻接矩阵表示社会网络,由于社会网络邻接矩阵具有低秩性,因此我们可以使用ALM算法优化邻接矩阵,解决链接预测问题。基于此方法,本文提出了一种多特征融合的链接预测框架,将拓扑结构特征和低秩特征融合在一起,进行了实验验证。实验结果表明,这种框架与传统基于拓扑结构的方法和单独使用ALM算法相比,更进一步提高了预测效果。同时,这个框架还保证了可扩展性,可将其它特征(如节点属性信息、社会学信息)融合进来,进一步分析动态网络链接预测问题。为了验证以上两点的可行性与有效性,本文选取了三个真实数据集进行实验验证,分别为USAir数据集、Net Science数据集、Jazz数据集,使用CN、AA、PA、RA、Jaccard方法作为基准方法,使用ROC曲线和AUC值评估实验结果。实验结果表明,本文提出的方法得到了预期的预测效果,而结合了多特征的链接预测框架更是显著提高了预测效果。
[Abstract]:In recent years, with the rapid development of web2.0 technology, the scale of social network is also growing, complex network analysis has become an important research task for researchers. As a branch of complex network analysis, link prediction is widely used in social network, biological information network, food web and many other aspects closely related to human life. Therefore, this paper delves into the problem of link prediction. In the field of data mining, the problem of link prediction plays a very important role in estimating the probability of the existence of links between two disconnected nodes based on the known information of the network. As an important research content in the field of data mining, link prediction has been studied for many years. It is divided into two types: one predicting unknown links and the other predicting future links. The first is to mine links that should exist but are not known, and the second is to predict links that do not exist in existing networks but may occur in the future. This paper focuses on predicting unknown links. The existing link prediction algorithms are divided into four categories: link prediction based on topology; link prediction based on sociological theory; link prediction based on machine learning; and link prediction based on matrix analysis. In this paper, the first point and the fourth point of the in-depth study. Put forward the following points of innovation: 1. In this paper, the link prediction algorithm based on topology structure is improved, and a new similarity measure method, CN-RA., is proposed by combining CN algorithm with RA algorithm. This method not only considers the number of common neighbors in the social network, but also considers the influence of a single common neighbor node on the node similarity. Compared with the CN algorithm and other benchmark algorithms based on topology structure, this method is more effective than the traditional algorithm. Better prediction effect. 2. 2. In this paper, a link prediction framework based on multi-feature fusion is proposed. Inspired by the existing link prediction methods based on matrix filling, we deeply study the augmented Lagrangian multiplier algorithm-ALM. Because the adjacent matrix of social network is of low rank, we can use ALM algorithm to optimize the adjacent matrix and solve the problem of link prediction. Based on this method, a link prediction framework based on multi-feature fusion is proposed, which combines topology features with low-rank features, and is verified by experiments. The experimental results show that compared with the traditional topology based method and the ALM algorithm alone, the prediction effect of this framework is further improved. At the same time, the framework also ensures scalability, and other features (such as node attribute information, sociological information) can be combined to further analyze the dynamic network link prediction problem. In order to verify the feasibility and validity of the above two points, this paper selects three real data sets for experimental verification, one is the USAir dataset net Science dataset and the other is the CN,AA,PA,RA,Jaccard method. ROC curves and AUC values were used to evaluate the experimental results. The experimental results show that the method proposed in this paper can achieve the expected prediction effect, and the link prediction framework with multiple features can significantly improve the prediction effect.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O157.5;TP311.13

【相似文献】

相关期刊论文 前10条

1 龚振和;基于矩阵表示和合一操作的并行推理方法[J];计算机学报;1988年02期

2 ;1998年第24期擂台赛点评[J];电脑爱好者;1999年06期

3 郝家欍;矩阵、概率与统计自学参考[J];煤矿机械;1985年03期

4 谭琼;如何形成网络流规划中的路矩阵[J];系统工程理论与实践;1992年04期

5 王以德,贾力普;快速算法及矩阵的新式分解[J];计算机应用与软件;1984年03期

6 黄禄炳,黄显高;矩阵应用中值得注意的问题[J];西安邮电学院学报;1997年01期

7 李大农;汉字邻接频率的矩阵表示[J];黄冈师专学报;1997年01期

8 杨秀文,严尚安,张洁,曾顺鹏;可达矩阵的新求法[J];电子科技大学学报;2000年06期

9 樊葆华;窦强;张鹤颖;;网络演算的矩阵解释[J];计算机学报;2009年12期

10 冯春生;;2维空间填充曲线的块矩阵迭代法[J];计算机工程与应用;2011年12期

相关会议论文 前2条

1 杨伟;;模糊软矩阵及其格结构[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年

2 陈文康;姚陈;;对Bond变换的若干思考[A];中国地球物理·2009[C];2009年

相关重要报纸文章 前1条

1 金_g;IT自考学习资源大搜索(一)[N];中国电脑教育报;2002年

相关博士学位论文 前9条

1 贺杨成;半监督低秩矩阵学习及其应用[D];上海交通大学;2015年

2 陈梅香;广义二次矩阵的若干研究[D];福建师范大学;2016年

3 郝晓丽;粒度格矩阵空间模型及其应用研究[D];太原理工大学;2009年

4 韩曦;基于多维矩阵的移动通信信号检测及参数估计技术研究[D];北京邮电大学;2013年

5 张芬;基于低秩矩阵填充的相位检索方法研究[D];安徽大学;2015年

6 方茂中;关于矩阵填充和非负矩阵的研究[D];华东师范大学;2008年

7 陈娜;矩阵恢复算法及误差分析[D];华中科技大学;2012年

8 耿娟;低秩矩阵与张量完整化问题的算法研究[D];中国农业大学;2014年

9 田贵贤;图谱理论和几类矩阵的谱与组合特征研究[D];电子科技大学;2009年

相关硕士学位论文 前10条

1 崔翔;基于卷积压缩感知的确定性测量矩阵研究[D];北京化工大学;2015年

2 吴曼;SDN在IP网络的流量调度应用研究[D];电子科技大学;2015年

3 王浩;带噪声抑制的流量矩阵估计方法研究[D];电子科技大学;2015年

4 张婷婷;基于低秩矩阵填充与恢复的图像去噪方法研究[D];河北工业大学;2015年

5 邓爱淘;基于LDPC码的压缩感知测量矩阵研究[D];湘潭大学;2015年

6 白平;基于拓展全息矩阵的变胞机构创新设计研究[D];武汉轻工大学;2015年

7 吴越;Vandermonde矩阵的理论与应用研究[D];安徽大学;2016年

8 曹萌;几类Bezout矩阵的研究[D];安徽大学;2016年

9 唐云;基于Spark的大规模分布式矩阵运算算法研究与实现[D];南京大学;2016年

10 陈露;关于矩阵运算的公开可验委托计算的研究与分析[D];苏州大学;2016年



本文编号:2229264

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2229264.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a631a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com