基于动态权重社交属性网的链接预测
发布时间:2017-05-13 05:28
本文关键词:基于动态权重社交属性网的链接预测,由笔耕文化传播整理发布。
【摘要】:社交网站为用户提供了一个沟通、交流、自我展示的平台,人们的沟通交流越来越依赖社交网络。社交网络中的链接预测不仅有助于研究人员了解网络的演化过程,还可以为社交网站的用户提供好友推荐功能,增加社交网络的稠密性,提高用户对网站的粘性。社交网络是一个随时间而动态变化的网络,社交网络中有用户实体之间的关系数据,还有用户实体的各种属性信息包括性别、年龄、兴趣等,链接预测应充分利用这些数据进行建模。本课题将链接预测问题视为一个二分类的机器学习问题,构建动态权重社交属性网,可以充分利用社交网络提供的各种数据。提取网络的时间特征、结构信息特征、属性信息特征,得到样本的特征向量后,利用机器学习算法进行链接预测。相对于规模庞大的社交网络,大多数用户只会和网络中的很少一部分用户产生交互,建立朋友关系,本课题利用过滤器进行样本过滤,避免计算无关联节点对的特征向量,从而提高预测算法的实时性,减少了训练过程和预测过程的时间。链接预测问题中存在大量的隐性负样本,只有少量的显性正样本,链接预测问题中负样本数量远远超出正样本的数量,本课题使用负样本欠抽样的方法保持正负样本数量均衡,提高监督分类器的性能。社交网络中的每个实体节点、每条链接都存在个体差异性,这是对网络的节点和边进行加权的理论基础。本课题在社交网络上实验了多种节点加权和边加权方案,在Google+数据集上实验结果表明在基于邻域的共同邻居的相似性特征计算方法中,当节点的权重和节点中心性成反比时,相比无权的网络特征预测性能会提升;边加权采用相似权也取得了预测性能的提升。社交网络随时间而动态变化,提取动态网络的时间特征相比无时间特征,链接预测性能要好。
【关键词】:链接预测 社交网络 社交属性网 加权网络 动态网络
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 绪论9-15
- 1.1 研究背景和意义9-10
- 1.1.1 课题研究背景9
- 1.1.2 课题研究的意义9-10
- 1.2 国内外研究现状10-13
- 1.2.1 国内外相关研究现状10-12
- 1.2.2 存在的问题及挑战12-13
- 1.3 本文主要研究内容13
- 1.4 本文组织结构13-15
- 第2章 社交网络链接预测方法介绍15-26
- 2.1 社交网络问题相关定义15-19
- 2.1.1 社交网络基础15-16
- 2.1.2 社交网络分析概述16-18
- 2.1.3 链接预测问题定义18-19
- 2.2 社交网络链接预测方法19-25
- 2.2.1 基于节点对相似度的链接预测方法19-23
- 2.2.2 基于分类的链接预测方法23-25
- 2.3 本章小结25-26
- 第3章 动态权重社交属性网的特征提取26-45
- 3.1 动态权重社交属性网26-28
- 3.2 节点和边的加权方法28-30
- 3.3 动态权重社交属性网的特征提取30-44
- 3.3.1 实验数据集31-33
- 3.3.2 实验评价标准33-34
- 3.3.3 局部相似度特征34-38
- 3.3.4 局部相似度指标分析38-39
- 3.3.5 全局相似度特征39-41
- 3.3.6 时间特征41-42
- 3.3.7 特征总结42-43
- 3.3.8 动态权重社交属性网对链接预测的作用和意义43-44
- 3.4 本章小结44-45
- 第4章 链接预测及实验结果与分析45-54
- 4.1 链接预测步骤45-48
- 4.1.1 链接预测系统步骤45-46
- 4.1.2 样本的抽取与过滤46-48
- 4.2 实验设计48-49
- 4.2.1 参数选择49
- 4.3 实验结果及分析49-53
- 4.3.1 权重网络和无权网络对比50-52
- 4.3.2 动态权重网和权重网对比52-53
- 4.4 本章小结53-54
- 结论54-56
- 参考文献56-60
- 附录60-62
- 致谢62
【参考文献】
中国期刊全文数据库 前1条
1 张珊靓;周晏;;基于随机游走的时间加权社会网络链接预测算法[J];计算机应用与软件;2014年07期
本文关键词:基于动态权重社交属性网的链接预测,,由笔耕文化传播整理发布。
本文编号:361698
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/361698.html