基于主题和关系的社交网络潜在好友推荐研究
本文关键词:基于主题和关系的社交网络潜在好友推荐研究,由笔耕文化传播整理发布。
【摘要】:社交网络(Social Network Site, SNS)作为Web2.0时代的典型应用,在世界各地迅速流行起来,现已成为人们日常生活中不可或缺的一部分。在社交网络中,用户通过添加、关注好友等方式建立和拓展属于自己的社交圈,从而进行互动交流以及信息分享。然而随着社交网络规模的扩大以及用户数量的急剧增长,寻找好友、拓展自己的社交圈对普通用户来说变得越来越困难。为了解决社交网络信息过载问题,社交网络好友推荐系统应运而生。研究表明,社交网络中的用户不仅与现实生活中认识的朋友建立联系,还希望通过社交网络这个平台添加、关注一些有着相同兴趣爱好的新朋友。然而目前对于这类兴趣相似的“潜在好友”的推荐研究较少,且没有SNS网站提供潜在好友推荐的功能,这极大程度上抑制了社交网络的发展。为进一步满足用户基于兴趣的交友需求,本文以微博为例,将研究重点放在“潜在好友”的推荐上。 目前社交网络好友推荐的方法中,基于关系的好友推荐所推荐的好友数量和范围非常有限,而基于内容的好友推荐所推荐好友的接受率和认可率较低。因此本文提出一种混合推荐模型,以期提高推荐效果。本文将主题模型引入到基于内容的推荐中,以解决传统向量空间模型(VSM)存在的不足。在主题推荐模块中,采用一种适用于社交网络的UserLDA模型,将同一位用户的所有微博文本聚集成一个用户文档,并采用Collapsed吉布斯抽样方法估计参数,将用户文档的在特征词上的向量转换成该用户在主题上的概率分布,以此体现其在隐藏“主题”上的兴趣偏好,从而根据用户的主题概率分布进行兴趣相似度的计算。在关系推荐模块中,将根据用户的链接关系网络计算关系相似度的过程看作是链接预测问题,对RA指数和Jaccard系数进行改进,使其适用于有向网络中,从计算用户之间的关系相似度。最后对两个推荐模块产生的相似度进行线性加权,根据得到的综合相似度向目标用户进行TOP-N潜在好友推荐。 为了验证本文提出模型的有效性,将其应用于真实的新浪微博数据中,,并与基于内容的传统向量空间模型以及基于关系的两阶段好友推荐模型进行实验对比,实验结果证明本文提出的混合推荐模型比其它模型具有较高的F1值,即能产生更好的推荐效果。
【关键词】:社交网络 潜在好友 好友推荐 主题模型 链接预测 Top-N推荐
【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F49
【目录】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 绪论11-18
- 1.1 研究背景11-12
- 1.2 社交网络12-15
- 1.2.1 社交网络理论基础12
- 1.2.2 社交网络基本特征12-13
- 1.2.3 社交网络分类13-14
- 1.2.4 微博14-15
- 1.3 研究目的及意义15
- 1.4 研究内容15-16
- 1.5 章节安排16-17
- 1.6 本章小结17-18
- 第二章 相关研究综述18-27
- 2.1 推荐系统研究综述18-22
- 2.1.1 协同过滤推荐18-20
- 2.1.2 基于内容的推荐20-22
- 2.2 社交网络好友推荐研究综述22-26
- 2.2.1 基于关系的好友推荐22-23
- 2.2.2 基于内容的好友推荐23-24
- 2.2.3 混合推荐24-25
- 2.2.4 名人推荐25-26
- 2.3 本章小结26-27
- 第三章 主题模型27-37
- 3.1 主题模型的引入27-28
- 3.2 主题模型的发展28
- 3.3 标准 LDA 模型28-31
- 3.3.1 LDA 模型示意图29-30
- 3.3.2 LDA 模型文档生成过程30
- 3.3.3 LDA 模型参数估计30-31
- 3.4 一种应用于社交网络的 LDA 扩展模型31-36
- 3.4.1 用户文档的构建与表示32-33
- 3.4.2 UserLDA 主题建模33-34
- 3.4.3 UserLDA 参数估计34-36
- 3.5 本章小结36-37
- 第四章 基于主题和关系的社交网络潜在好友推荐模型37-47
- 4.1 问题引出37
- 4.2 推荐模型框架37-39
- 4.3 基于链接预测的关系推荐模块39-42
- 4.3.1 链接预测问题39
- 4.3.2 社交网络表示39-40
- 4.3.3 改进的 RA 指数40-41
- 4.3.4 改进的 Jaccard 系数41-42
- 4.3.5 关系相似度计算42
- 4.4 基于 UserLDA 模型的主题推荐模块42-46
- 4.4.1 UserLDA 模型输入43
- 4.4.2 参数估计43-45
- 4.4.3 兴趣相似度计算45-46
- 4.5 综合相似度计算46
- 4.6 本章小结46-47
- 第五章 实验及结果分析47-59
- 5.1 实验平台47
- 5.1.1 实验环境47
- 5.1.2 相关工具47
- 5.2 实验数据47-52
- 5.2.1 数据采集48-50
- 5.2.2 数据预处理50-52
- 5.3 评价指标52-53
- 5.4 实验设计和结果分析53-58
- 5.4.1 UserLDA 主题模型分析53-56
- 5.4.2 潜在好友推荐及结果分析56-57
- 5.4.3 对比实验及结果分析57-58
- 5.5 本章小结58-59
- 第六章 总结与展望59-61
- 6.1 工作总结59
- 6.2 不足与展望59-61
- 6.2.1 本文存在的不足59-60
- 6.2.2 展望60-61
- 致谢61-62
- 参考文献62-65
- 附录65
【参考文献】
中国期刊全文数据库 前10条
1 罗宁;徐俊刚;郭洪韬;;基于Lucene的中文分词模块的设计和实现[J];电子技术;2012年09期
2 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
3 东昱晓;柯庆;吴斌;;基于节点相似性的链接预测[J];计算机科学;2011年07期
4 余力,刘鲁;电子商务个性化推荐研究[J];计算机集成制造系统;2004年10期
5 张小平;周雪忠;黄厚宽;冯奇;陈世波;;基于词相似性与CRP的主题模型[J];模式识别与人工智能;2010年01期
6 贺超波;汤庸;陈国华;刘海;吴琳琳;;面向大规模社交网络的潜在好友推荐方法[J];合肥工业大学学报(自然科学版);2013年04期
7 胡爱娜;;基于MapReduce的分布式EM算法的研究与应用[J];科技通报;2013年06期
8 张志飞;苗夺谦;高灿;;基于LDA主题模型的短文本分类方法[J];计算机应用;2013年06期
9 谢昊;江红;;一种面向微博主题挖掘的改进LDA模型[J];华东师范大学学报(自然科学版);2013年06期
10 陈克寒;韩盼盼;吴健;;基于用户聚类的异构社交网络推荐算法[J];计算机学报;2013年02期
中国博士学位论文全文数据库 前1条
1 邢星;社交网络个性化推荐方法研究[D];大连海事大学;2013年
本文关键词:基于主题和关系的社交网络潜在好友推荐研究,由笔耕文化传播整理发布。
本文编号:405564
本文链接:https://www.wllwen.com/guanlilunwen/sjfx/405564.html