基于信任关系与主题分析的微博用户推荐技术
本文关键词:基于信任关系与主题分析的微博用户推荐技术,,由笔耕文化传播整理发布。
【摘要】:社交网站的快速发展深刻影响到了人们的信息共享和交流方式,而作为开放式在线的社交平台,社交网站的成功基本取决于用户的交互程度和用户黏性。随着用户规模的暴发性增长,推荐准确的潜在好友对社交网站运营方的意义越来越大。 本文首先探讨了现行的几种好友推荐机制,针对传统推荐算法未考虑推荐过程中的信任问题,设计了一种社交网络中的信任模型,以度量用户信誉度及用户间的信任关系。之后将信誉度小于某一阈值的用户过滤,并对剩余的可信用户划分子群、依据用户间话题相似度生成最终推荐列表。旨在向用户推荐其感兴趣的潜在好友,帮助用户扩大朋友圈子,进而提高用户粘性。本文主要工作如下: 第一,在进行用户间信任强度建模时,综合考虑了社交网络中的结构化信息以及用户之间的交互强度、关注话题相似度等多个因素,构建了包含三类节点的异构网络图,在其上提出了一种多因素综合考虑的信任模型。针对三种信任度如何加权的问题,首先从信任关系的定义出发,给出一个优化目标方程,再根据少量已标注数据对方程中的参数进行求解,最终求得参数值。 第二,在进行用户的主题识别时,考虑到微博文本短、有噪音等实际特点,利用微博内容上的标签(hashtag),先将用户内类似的微博聚集起来,通过增加一个文档中的内容,增强词组之间的共现关系,再利用主题模型进行识别。 第三,在进行不可信用户识别时,引入信誉度的概念,针对大规模社交网络中数据标注较为困难的特点,利用上一步中的信任关系模型,从少量已标注数据出发,对未标注的节点计算信誉度。此处传播的是信誉度,未采用传统的机器学习算法进行分类判别,而是对于每个节点更新其信誉度,最终超过0的判别为可信,低于0的判别为不可信。 第四,在进行基于信任模型的社区划分算法时,首先参考PGP算法里的推荐者信任模型,在直接信任的基础上考虑推荐信任,提出一种基于信任传播的社区划分算法。还利用了MapReduce思想对算法进行并行化设计,使得算法具有较好的可扩展性。
【关键词】:社交网络 信任关系 信誉度 社区 主题模型
【学位授予单位】:华东理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092;TP391.3
【目录】:
- 摘要5-6
- Abstract6-8
- 目录8-10
- 第1章 绪论10-14
- 1.1 研究背景10-11
- 1.2 研究意义11-12
- 1.3 本文工作12
- 1.3.1 主要研究内容12
- 1.3.2 研究目标12
- 1.4 本文结构12-14
- 第2章 社交网络中用户推荐相关技术介绍14-33
- 2.1 好友推荐技术的研究现状14-15
- 2.1.1 基于用户特征的好友推荐14
- 2.1.2 基于用户关系网络的好友推荐14-15
- 2.2 社交网络中不可信用户检测的研究现状15-16
- 2.3 社区划分的研究现状16-18
- 2.3.1 基于优化目标函数的复杂网络社区划分方法17-18
- 2.3.2 启发式的复杂网络聚类方法18
- 2.4 微博话题识别的研究现状18-19
- 2.5 社交网络中的信任度19-20
- 2.6 支持向量机模型20-26
- 2.6.1 最大间隔超平面21
- 2.6.2 线性可分支持向量分类机(线性硬间隔分类机)21-22
- 2.6.3 线性不可分支持向量分类机(线性软间隔分类机)22-23
- 2.6.4 非线性可分支持向量分类机(非线性硬间隔分类机)23-24
- 2.6.5 非线性不可分支持向量分类机(非线性软间隔分类机)24
- 2.6.6 核函数24-26
- 2.7 并行化编程模型MapReduce26-28
- 2.7.1 MapReduce编程模型26-28
- 2.7.2 Hadoop平台28
- 2.8 微博爬虫技术的研究现状28-32
- 2.8.1 JSoup解析器简介29-31
- 2.8.2 Socket简介31
- 2.8.3 Net平台下的WebBrowser控件31-32
- 2.9 本章小结32-33
- 第3章 基于信任关系及主题分析的推荐算法33-56
- 3.1 算法整体框架33-35
- 3.2 微博数据爬取模块35-37
- 3.2.1 AJAX页面内容的获取35
- 3.2.2 信息抽取35-36
- 3.2.3 微博爬虫模块设计36-37
- 3.3 微博数据预处理模块37-41
- 3.3.1 LDA(Latent Dirichlet Allocation)主题模型38-39
- 3.3.2 Gibbs抽样39-40
- 3.3.3 用户关注主题向量的挖掘40-41
- 3.4 社交网络中信任模型生成模块41-54
- 3.4.1 用户间信任模型的构建41-44
- 3.4.2 不可信用户的过滤44-46
- 3.4.3 基于用户信任链的社区发现算法46-54
- 3.5 推荐列表生成模块54-55
- 3.6 本章小结55-56
- 第4章 实验效果与评估56-65
- 4.1 不可信用户识别实验效果评估56-58
- 4.1.1 实验环境及实验数据56-57
- 4.1.2 基准方法的选择57
- 4.1.3 实验结果分析57-58
- 4.2 基于信任度的用户社区划分算法实验效果评估58-61
- 4.2.1 实验环境及实验数据59
- 4.2.2 精准度对比59-60
- 4.2.3 可扩展性60-61
- 4.3 用户推荐算法实验效果评估61-63
- 4.3.1 评价方法61-62
- 4.3.2 实验结果评估与分析62-63
- 4.4 本章小结63-65
- 第5章 总结和展望65-67
- 5.1 本文总结65-66
- 5.2 不足与展望66-67
- 参考文献67-71
- 致谢71-72
- 攻读硕士学位期间发表的论文72
【参考文献】
中国期刊全文数据库 前10条
1 闫瑞;曹先彬;李凯;;面向短文本的动态组合分类算法[J];电子学报;2009年05期
2 李勇军;代亚非;;对等网络信任机制研究[J];计算机学报;2010年03期
3 雷环;彭舰;;SNS中结合声誉与主观逻辑的信任网络分析[J];计算机应用研究;2010年06期
4 彭泽映;俞晓明;许洪波;刘春阳;;大规模短文本的不完全聚类[J];中文信息学报;2011年01期
5 王晟;王子琪;张铭;;个性化微博推荐算法[J];计算机科学与探索;2012年10期
6 胡文江;胡大伟;高永兵;郝斌;;基于关联规则与标签的好友推荐算法[J];计算机工程与科学;2013年02期
7 Marcelo G.Armentano;Daniela Godoy;Analía Amandi;;Topology-Based Recommendation of Users in Micro-Blogging Communities[J];Journal of Computer Science & Technology;2012年03期
8 彭泽环;孙乐;韩先培;石贝;;基于排序学习的微博用户推荐[J];中文信息学报;2013年04期
9 毛佳昕;刘奕群;张敏;马少平;;基于用户行为的微博用户社会影响力分析[J];计算机学报;2014年04期
10 彭泗清;信任的建立机制:关系运作与法制手段[J];社会学研究;1999年02期
本文关键词:基于信任关系与主题分析的微博用户推荐技术,由笔耕文化传播整理发布。
本文编号:284410
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/284410.html