当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于主题模型的个性化信息推荐

发布时间:2017-05-16 15:24

  本文关键词:基于主题模型的个性化信息推荐,由笔耕文化传播整理发布。


【摘要】:在当今的互联网时代,人们每天都会产生大量的信息,信息的增长速度已经远远大于人类可以容纳的上限。在这个信息过载的时代,从海量的信息中高效地筛选出人们所需要的信息是至关重要的。从搜索引擎到推荐系统,都是为了解决这个问题而发展起来的。另一方面,当今的互联网时代已然是移动互联网时代,,用户每天在互联网上产生的数据越来越多,数据的价值也越来越大,根据这些数据,为用户提供个性化服务已经是主流趋势。其中,微博等社交网络便是一个巨大的用户数据源,如何利用这些数据分析用户的兴趣,是近年来的研究热点。 本文便是在微博数据的基础上,研究如何挖掘用户的兴趣并对其进行个性化推荐。首先,本文对LDA主题模型进行了深入研究及分析,并研究了其在微博领域的应用,得出了LDA不适合直接应用于微博短文本的结论。继而提出了一种针对微博用户的建模方法:合并用户的微博集合,建立一个用户—主题—单词的三层模型,用户对话题的感兴趣程度便可以用这个模型来表示。然后,根据用户的主题分布之间的相似性,提出了相似用户的推荐算法,我们设计了基于向量空间模型和隐马尔科夫模型的对比实验,实验数据采用从新浪微博采集的真实数据,结果表明,该方法具有很好的效果,具有很大的应用价值。其次,本文利用微博用户的社交特征,提出了利用其粉丝和关注关系计算用户价值的方法,并将其利用到推荐算法中,用以产生不同侧重点的推荐列表,更好地满足各种用户的不同需求。最后,本文还提出了一种利用用户主题模型进行新闻推荐的方法,将其和基于非负矩阵的推荐方法做对比实验,结果表明,本文提出的算法不但可以发现用户对某个主题的兴趣,还能得出其对多个主题的兴趣分布。而现实中的用户一般都会有多个感兴趣的主题,本算法可以根据用户的多重兴趣分布,为其推荐多个感兴趣话题下的新闻,可以更好地满足用户需求。
【关键词】:主题模型 LDA 微博 用户模型 个性化推荐
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
  • 摘要4-5
  • Abstract5-8
  • 第1章 绪论8-13
  • 1.1 研究背景与意义8-9
  • 1.2 国内外研究现状9-11
  • 1.3 本文研究内容11
  • 1.4 本文组织结构11-13
  • 第2章 主题模型概述13-20
  • 2.1 主题模型简介13-14
  • 2.2 潜在狄利克雷分配 LDA 模型14-17
  • 2.2.1 模型介绍14-16
  • 2.2.2 参数估计16-17
  • 2.3 其他常用主题模型17-19
  • 2.4 本章小结19-20
  • 第3章 基于主题模型的微博信息推荐方法研究20-38
  • 3.1 噪音微博的过滤20-23
  • 3.1.1 朴素贝叶斯分类器20-22
  • 3.1.2 基于朴素贝叶斯的噪音微博过滤22-23
  • 3.2 基于 LDA 模型的微博用户模型23-25
  • 3.3 基于隐马尔科夫模型的用户模型25-27
  • 3.3.1 隐马尔科夫模型介绍25-27
  • 3.3.2 基于 HMM 为用户建模27
  • 3.4 个性化微博用户推荐27-29
  • 3.4.1 相似度计算27-28
  • 3.4.2 用户推荐算法28-29
  • 3.5 微博用户个体价值在推荐中的作用29-33
  • 3.5.1 PageRank 与 PeopleRank29-32
  • 3.5.2 用户价值的衡量及其应用32-33
  • 3.6 个性化新闻推荐33-37
  • 3.6.1 新闻网页正文信息提取33-35
  • 3.6.2 基于非负矩阵分解的新闻推荐算法35-36
  • 3.6.3 基于 LDA 的新闻推荐算法36-37
  • 3.7 本章小结37-38
  • 第4章 微博用户个性化推荐系统设计与实现38-46
  • 4.1 系统简介38-39
  • 4.2 系统整体架构39-42
  • 4.3 系统模块设计42-45
  • 4.3.1 数据采集模块42-43
  • 4.3.2 预处理模块43-44
  • 4.3.3 主题分析模块44
  • 4.3.4 个性化推荐模块44-45
  • 4.4 本章小结45-46
  • 第5章 实验评估与结果分析46-68
  • 5.1 微博数据预处理46-50
  • 5.1.1 实验设计46-48
  • 5.1.2 实验结果及分析48-50
  • 5.2 用户主题模型的构建50-54
  • 5.2.1 基于 LDA 主题模型的用户模型50-51
  • 5.2.2 LDA 用户模型评价方法51-52
  • 5.2.3 其他用户建模方法52-54
  • 5.3 微博用户推荐54-61
  • 5.3.1 实验设计54-56
  • 5.3.2 实验结果及分析56-58
  • 5.3.3 基于用户价值的改进实验58-61
  • 5.4 新闻页面推荐61-67
  • 5.4.1 实验设计61-62
  • 5.4.2 实验结果及分析62-67
  • 5.5 本章小结67-68
  • 结论68-70
  • 参考文献70-74
  • 攻读硕士学位期间发表的学术论文74-76
  • 致谢76

【相似文献】

中国期刊全文数据库 前10条

1 吴玲达,谢毓湘,栾悉道,肖鹏;互联网多媒体主题信息自动收集与处理系统的研制[J];计算机应用研究;2005年05期

2 蒋凡,高俊波,张敏,王煦法;BBS中主题发现原型系统的设计与实现[J];计算机工程与应用;2005年31期

3 周亦鹏;杜军平;;基于时空情境模型的主题跟踪[J];华南理工大学学报(自然科学版);2012年08期

4 陈雄;都云程;李渝勤;施水才;;基于页面结构分析的论坛主题信息定位方法研究[J];微计算机信息;2010年27期

5 何利益;陆国锋;罗鹏;;动态新闻主题信息推荐系统设计[J];指挥信息系统与技术;2013年04期

6 关慧芬;师军;;基于本体的主题爬虫技术研究[J];计算机仿真;2009年10期

7 张宇;宋巍;刘挺;李生;;基于URL主题的查询分类方法[J];计算机研究与发展;2012年06期

8 欧健文,董守斌,蔡斌;模板化网页主题信息的提取方法[J];清华大学学报(自然科学版);2005年S1期

9 吕聚旺;都云程;王弘蔚;施水才;;基于新型主题信息量化方法的Web主题信息提取研究[J];现代图书情报技术;2008年12期

10 朱梦麟;李光耀;周毅敏;;基于树比较的Web页面主题信息抽取[J];微型机与应用;2011年19期

中国重要会议论文全文数据库 前7条

1 吴晨;宋丹;薛德军;师庆辉;;科技主题识别及表示[A];第五届全国信息检索学术会议论文集[C];2009年

2 熊方;王晓宇;郑骏;周傲英;;ITED:一种基于链接的主题提取和主题发现系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

3 王玉婷;杜亚军;涂腾涛;;基于Web链接的主题爬行虫初始URL的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 冯少卿;都云程;施水才;;基于模板的网页主题信息抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

5 王琦;唐世渭;杨冬青;王腾蛟;;基于DOM的网页主题信息自动提取[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

6 刁宇峰;王昊;林鸿飞;杨亮;;博客中重复评论发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

7 曹红;袁津生;;多领域主题搜索引擎研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年

中国博士学位论文全文数据库 前2条

1 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年

2 薛利;面向证券应用的WEB主题观点挖掘若干关键问题研究[D];复旦大学;2013年

中国硕士学位论文全文数据库 前10条

1 薛耀兵;科技文献中的主题发现与趋势预测[D];哈尔滨工业大学;2013年

2 陈浩;自定义主题信息抽取的研究与应用[D];大连理工大学;2008年

3 吴彦文;主题信息合理性、语境意义偏向性对汉语句子歧义消解的实验研究[D];陕西师范大学;2002年

4 戴兴虎;基于主题的学术网络构建[D];浙江大学;2013年

5 吴晓娜;基于特征、先验和约束的主题建模算法[D];苏州大学;2014年

6 邸亮;基于主题模型的个性化信息推荐[D];北京工业大学;2014年

7 亓晓青;Web挖掘中的主题模型扩展[D];北京邮电大学;2013年

8 徐枫;基于主题爬虫的视频教程库的研究与设计[D];广西大学;2014年

9 徐西孟;基于OODA决策循环的主题发现技术的研究与设计[D];济南大学;2011年

10 刘欣宇;基于主题策略的Web信息监测系统研究与实现[D];重庆大学;2011年


  本文关键词:基于主题模型的个性化信息推荐,由笔耕文化传播整理发布。



本文编号:371233

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/371233.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户76dfc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com