当前位置:主页 > 社科论文 > 社会学论文 >

Hybrid-LDA:一种融合用户文本内容与链接信息的兴趣挖掘技术

发布时间:2017-06-02 23:04

  本文关键词:Hybrid-LDA:一种融合用户文本内容与链接信息的兴趣挖掘技术,由笔耕文化传播整理发布。


【摘要】:社交网络的蓬勃发展为人与人之间的交互行为带来巨大便利,随着时间的推移,社交网络积累了大量的用户数据,这些数据不仅涵盖了用户平时发表的言论、照片以及位置信息,同时包含了用户间的社交关系,为研究者带来了巨大的研究价值。其中,用户兴趣的挖掘有着重要的研究意义,这方面的深入研究可以为用户个性化内容推荐提供依据。目前,主题模型是挖掘用户兴趣的常用模型,而用户所发表的言论是主要的挖掘对象。基于用户推文是词汇上的分布,主题模型引入了主题作为隐式变量,将用户描述为多个主题的组合,再将主题描述为不同词汇上的分布,进而获得用户在多个主题上的分布。目前,隐式狄利克雷分布(LDA)是主题模型中最经典、有效的方法。本文以Twitter数据作为研究背景,目的在于挖掘Twitter用户的兴趣。本文认为,分析用户的兴趣不仅需要考虑用户自身所发布的推文内容,并且需要考虑用户的其他其维度的信息(比如用户的关注信息)。基于上述思想,本文提出了改进模型Hybrid-LDA,该模型不仅考虑用户自身的推文内容,同时考虑用户关注对象的推文内容以及对不同关注对象的转发次数的差异这些维度的信息。通过这种方法,本文能够融合用户推文内容与链接信息。通过实验,本文发现Hybrid-LDA相比LDA有一定程度的性能提升,验证本文所提出模型的有效性。
【关键词】:社交网络 兴趣挖掘 主题模型 贝叶斯 LDA Twitter
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:C81
【目录】:
  • 摘要10-11
  • ABSTRACT11-12
  • 主要符号对照表12-13
  • 第一章 引言13-20
  • §1.1 研究背景与意义13-16
  • §1.2 国内外研究现状16-17
  • §1.3 本文的研究方法17
  • §1.4 本文的研究难点与挑战17-18
  • §1.5 本文的研究内容与创新18-19
  • §1.6 本文的组织架构19-20
  • 第二章 相关工作20-27
  • §2.1 主题模型20-23
  • §2.2 LDA模型23-24
  • §2.3 基于社交网络的主题挖掘技术24-26
  • §2.3.1 基于推文内容的主题挖掘技术25
  • §2.3.2 基于非推文内容的主题挖掘技术25-26
  • §2.4 小结26-27
  • 第三章 Hybrid-LDA主题模型27-39
  • §3.1 Hybrid-LDA模型介绍27-39
  • §3.1.1 模型描述及文档生成过程28-29
  • §3.1.2 模型推导及求解29-37
  • §3.1.3 算法37-39
  • 第四章 实验评估39-49
  • §4.1 实验数据39
  • §4.2 实验设计39-44
  • §4.2.1 参数选择40-41
  • §4.2.2 聚类方法41-42
  • §4.2.3 评估指标42-43
  • §4.2.4 聚类方法43
  • §4.2.5 评估方法43-44
  • §4.3 实验分析44-48
  • §4.3.1 UserTweet-LDA44-45
  • §4.3.2 LinkTweet-LDA45-46
  • §4.3.3 MixTweet-LDA46
  • §4.3.4 Hybrid-LDA46-48
  • §4.4 小结48-49
  • 结论49-51
  • §4.5 研究工作总结49
  • §4.6 未来工作展望49-51
  • 参考文献51-54
  • 致谢54

【相似文献】

中国硕士学位论文全文数据库 前1条

1 颜晓勉;Hybrid-LDA:一种融合用户文本内容与链接信息的兴趣挖掘技术[D];华东师范大学;2016年


  本文关键词:Hybrid-LDA:一种融合用户文本内容与链接信息的兴趣挖掘技术,由笔耕文化传播整理发布。



本文编号:416709

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/416709.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b215b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com