基于社交网络节点特性的链路预测算法研究
本文选题:社交网络 切入点:链路预测 出处:《新疆大学》2017年硕士论文 论文类型:学位论文
【摘要】:如今计算机技术飞速发展,网络技术改变了人们的生活。各种社交网站的流行及智能终端的普及,使人们在虚拟的网络中留下了海量的、真实的数据,这为网络分析研究提供了数据基础。随着社交网络的不断壮大,人们在享受丰富的数字生活带来便捷的同时也感受到了信息膨胀带来的烦恼,即人们无法在海量数据中快速有效地提取的最相关的信息价值。对网络中可能存在或者已存在但未被发现的链接进行预测,有利于分析网络数据的缺失、分析复杂网络演化机制等问题,该研究在社交网络分析中具有重要意义。根据网络中已有的链接信息预测将来可能产生的链接,是网络分析的基本问题,在商业社交应用界也被广泛需求。目前,主要有基于局部信息相似性、基于路径和基于随机游走三类链路预测算法。基于局部信息相似性的算法运算简单,算法复杂度低,预测精度也相对较低,是目前运用最广泛的链路预测方法。基于路径和基于随机游走的方法较复杂,算法的时间复杂度高,对实际社交网络的应用性低。现有的基于局部相似性的链路预测方法,多数仅使用节点度进行预测,没有体现出重要节点度的作用,因此使算法的预测效果降低。提升链路预测精度是复杂网络研究的基础问题之一。本文对社交网络中链路预测问题进行了研究,主要工作和贡献如下:1、一些具有重要作用的节点可能具有更大的影响力或者更强的信息传播能力,现有的基于节点相似的链路预测指标没有充分利用网络节点的重要性,针对该问题提出基于节点重要性的链路预测算法,新的算法在共同邻居、Adamic-Adar、Resource Allocation相似性算法的基础上,充分利用了节点度中心性、接近中心性及介数中心性的信息,提出考虑节点重要性的CN、AA、RA链路预测相似性算法。改进的算法在4个真实数据集上进行仿真实验,以AUC值作为链路预测精度评价指标,实验结果表明,改进的算法在4个数据集上的链路预测精度均高于对比算法,能够对复杂网络结构产生更精确的分析预测。2、通过挖掘节点的邻居节点间的深层次的相互作用,对共同邻居节点所携带的网络二级结构拓扑信息进行过滤,提出节点聚类能力的计算方法。3、现有的基于局部信息相似性的链路预测指标没有充分考虑节点的聚类信息,在传统网络节点信息分类的基础上,通过网络中更稳定的三角形关系对二级拓扑结构信息进行过滤,提出基于节点聚类能力的链路预测方法。新的算法充分使用了共同邻居节点的聚类信息,使聚类能力强的节点在链路预测过程中发挥更大的作用。改进的算法在四类真实数据集上以MATLAB为仿真工具进行实验,在各数据集上以AUC和Precision为指标,改进的算法能够产生更准确的预测结果。
[Abstract]:Nowadays, with the rapid development of computer technology, network technology has changed people's lives. The popularity of various social networking sites and the popularity of intelligent terminals make people leave massive, real data in the virtual network. This provides a data base for network analysis research. As social networks continue to grow, people enjoy the convenience of a rich digital life and feel the annoyance of information inflation. That is, the most relevant information value that people can not extract quickly and effectively from the massive data. It is helpful to analyze the missing of network data by predicting the links that may exist or exist but are not found in the network. Analyzing the evolution mechanism of complex networks is of great significance in the analysis of social networks. It is the basic problem of network analysis to predict the possible links in the future according to the existing link information in the network. At present, there are three kinds of link prediction algorithms based on local information similarity, path and random walk. The algorithm based on local information similarity is simple, and the algorithm complexity is low. The prediction accuracy is also relatively low, which is the most widely used link prediction method. The method based on path and random walk is more complex, and the time complexity of the algorithm is high. Most of the existing link prediction methods based on local similarity only use node degree to predict, which does not reflect the function of important node degree. Therefore, the prediction effect of the algorithm is reduced. Improving the link prediction accuracy is one of the basic problems in the research of complex networks. In this paper, the link prediction problem in social networks is studied. The main work and contributions are as follows: 1. Some important nodes may have greater influence or greater ability to disseminate information. Existing link prediction indicators based on similar nodes do not take full advantage of the importance of network nodes. In order to solve this problem, a link prediction algorithm based on node importance is proposed. Based on the common neighbor Adamic-Adarresource Allocation similarity algorithm, the new algorithm makes full use of the information of node centrality, proximity centrality and intermediate centrality. A link prediction similarity algorithm considering node importance is proposed. The improved algorithm is simulated on four real data sets, and the AUC value is used as the evaluation index of link prediction accuracy. The experimental results show that, The improved algorithm has higher link prediction accuracy on the four data sets than the contrast algorithm, which can produce more accurate analysis and prediction of complex network structure. The network secondary structure topology information carried by the common neighbor node is filtered, and the calculation method of node clustering ability is proposed. The existing link prediction index based on the similarity of local information does not fully consider the clustering information of the node. On the basis of the traditional network node information classification, the secondary topology information is filtered through the more stable triangle relation in the network. A link prediction method based on node clustering ability is proposed. The new algorithm makes full use of the clustering information of common neighbor nodes. The improved algorithm is tested on four kinds of real data sets using MATLAB as simulation tool and AUC and Precision as indexes on each data set. The improved algorithm can produce more accurate prediction results.
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09
【相似文献】
相关期刊论文 前10条
1 郭桂蓉,申强;浮窗零阶预测算法所获压缩比的统计计算[J];电子学报;1986年01期
2 王万良;正交逼近预测算法及其在电脑充绒机中的应用[J];信息与控制;1994年04期
3 李文泽;盛光磊;;一种基于粒子群的实际业务流预测算法[J];微电子学与计算机;2014年01期
4 杨断利;张立梅;籍颖;吕晶;;河北省风能特征及其对风速预测算法的改进[J];科技传播;2013年06期
5 朱斌;樊祥;马东辉;程正东;;窗口大小和权值模板对固定权值背景预测算法的影响[J];红外与激光工程;2006年S4期
6 王祖俪;程小平;;入侵响应中基于事件相关性的攻击预测算法[J];计算机科学;2005年04期
7 徐庆飞;张新;李卫民;;二维空间中目标轨迹预测算法研究与分析[J];航空电子技术;2012年01期
8 杨双懋;郭伟;唐伟;;基于FARIMA-GARCH模型的网络业务预测算法[J];通信学报;2013年03期
9 李楚斐;谭长庚;韩宇;;车辆网络单跳链路断开时间预测算法[J];计算机工程;2012年02期
10 周璇;杨建成;;基于支持向量回归机的空调逐时负荷滚动预测算法[J];中南大学学报(自然科学版);2014年03期
相关会议论文 前10条
1 朱斌;樊祥;马东辉;程正东;;窗口大小和权值模板对固定权值背景预测算法的影响[A];2006年全国光电技术学术交流会会议文集(D 光电信息处理技术专题)[C];2006年
2 王峰;姬冰辉;李斗;;一种基于混沌理论的自相似业务流预测算法研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
3 钱正祥;徐华;张申浩;;数字信号序列的向量预测算法[A];第三届全国信息获取与处理学术会议论文集[C];2005年
4 郭景峰;代军丽;马鑫;王娟;;针对通信社会网络的时间序列链接预测算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
5 张利萍;李宏光;;改进的灰色预测算法在工业应用中的评价[A];第二届全国信息获取与处理学术会议论文集[C];2004年
6 崔冬;;一种改进的LRP信道预测算法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
7 王佳;殷海兵;周冰倩;;一种适合硬件实现的低复杂度MAD预测算法[A];浙江省电子学会2011学术年会论文集[C];2011年
8 郑铭浩;刘志红;巫瑞波;徐峻;;P450各亚型代谢调控剂预测算法[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
9 张晓丹;王萍;;一种基于特征的H.264的子块快速帧内预测算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
10 刘志红;郑铭浩;严鑫;巫瑞波;徐峻;;基于结构的化合物稳定性预测算法[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
相关博士学位论文 前2条
1 马玉韬;基于滤波理论和特征统计的蛋白质编码区预测算法研究[D];天津大学;2013年
2 玄萍;MicroRNA识别及其与疾病关联的预测算法研究[D];哈尔滨工业大学;2012年
相关硕士学位论文 前10条
1 吴智勇;学术论文排序预测算法研究[D];内蒙古大学;2015年
2 张勇攀;针对残缺IP网络的链路预测技术研究[D];哈尔滨工业大学;2015年
3 应超;博物馆移动导览中的远程展示技术研究及系统实现[D];浙江大学;2015年
4 常艳华;基于数据驱动模拟电路故障预测算法实现与软件开发[D];电子科技大学;2015年
5 闫青;基于预测算法的快速多尺度金字塔时空特征点计算算法研究[D];青岛科技大学;2016年
6 钱吕见;复杂网络中基于角色传递性和对称性的链接预测算法研究[D];兰州大学;2016年
7 李小科;无模型自适应预测算法及其在非线性过程控制中的应用[D];兰州大学;2016年
8 周攀;基于姿态传感器的人体步态预测算法设计与实现[D];西南交通大学;2016年
9 周真争;基于社团综合属性的链路预测算法研究[D];南京信息工程大学;2016年
10 任程;DSP+FPGA平台功耗管理的研究与实现[D];哈尔滨工业大学;2016年
,本文编号:1630715
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1630715.html