基于主题模型的用户兴趣挖掘及上下文感知推荐系统算法研究
本文关键词: 主题模型 上下文感知 推荐系统 出处:《山东大学》2017年硕士论文 论文类型:学位论文
【摘要】:互联网技术的发展使得数字信息资源开始呈现几何倍数的增长,反映在智能电视领域,则表现为每日海量视频数据的产生,用户互动行为的多样性,及随之而来的用户行为数量激增。随着国家"三网融合"等战略的推进,与智能电视用户需求的不断扩大,如何处理并有效利用大规模数据已经成为该领域一个亟待解决的难题。由于大数据、搜索引擎、个性化推荐技术的蓬勃发展,这一问题已经受到重视,并逐渐衍生出一些解决方案。目前,个性化推荐系统已经得到了广泛的研究和应用,它能够帮助用户更好的挖掘自身兴趣,协助建立系统的用户画像,有助于维持用户对内容的关注程度,避免相关业务的用户流失。目前推荐系统主要的计算方法分为基于模型的构建和基于邻域的构建。基于模型构建的推荐系统能够准确地表达用户兴趣,在推荐效果上有突出表现,而基于邻域的构建相对来说更加简单易行,且具有良好的可解释性。如何能够有效地结合两种模型的长处共同构建推荐系统模型,是本文的一个研究重点。另外,在针对电视推荐系统的业务逻辑中,由于电视是共享终端,在不同时间上下文情况下表现出的用户兴趣会有较大差异,如何合理引入时间上下文相关概念建模以提升推荐效果,也是本文关注的重点。所以,在本文的研究工作中,我们首先提出一种基于短文本LDA主题模型的推荐算法。该算法是基于模型的推荐挖掘,将文本挖掘领域的潜语义模型应用到推荐系统中,用以准确构建用户的主题兴趣。该算法针对视频推荐系统中用户观看过的视频通常较少这一数据稀疏性问题,做了特殊处理,将原本LDA算法中对视频项进行建模,转变为直接对视频共现对进行建模并采样计算。这一处理极大地解决数据稀疏性问题,并能够有效地提升用户兴趣挖掘的准确度。故我们引入短文本的LDA主题模型,并将用户观看记录转化为低维空间中的两个矩阵,即用户兴趣矩阵(用户-主题),和视频从属度矩阵(主题-视频)。在准确获取到用户兴趣的基础上,为了解决电视共享终端的推荐问题,我们引入时间上下文信息并构建基于用户兴趣的协同过滤推荐算法。该算法首先是一个基于邻域的推荐算法,对具有类似兴趣的用户相互推荐视频,在构建用户兴趣的时候引入前过滤的上下文感知推荐策略,在构建视频共现对这一处理过程中,加入上下文环境约束,只对处于同一个时间上下文环境中的视频集合中的元素构建视频对。这一前过滤策略有效地引入时间上下文信息,能够有效区分不同时间段上的用户兴趣情况,避免将不相关的视频构建成为同一个视频共现对。另外,在召回推荐列表并最终排序的时候,再次引入后过滤的上下文感知推荐策略,为每一个视频在当下环境中是否值得被推荐进行加权,加权的依据则是该用户在当前上下文中的兴趣主题分布。该后过滤方法能够在用户兴趣的基础上针对请求推荐列表的时间上下文做进一步筛选,能够极大提高推荐效果。为了实验验证模型的推荐效果,我们使用国内知名电视推荐平台,海信电视云平台的真实数据集,提供多种对比推荐算法,并在多样的数据评测指标上进行评估。我们的方法在该数据集上取得了较高的召回率及MAP、MRR等指标,明显优于其他传统推荐算法及上下文推荐算法,进而证明了本文方法的有效性。
[Abstract]:The development of Internet technology makes the digital information resources began to multiply, reflected in the field of smart TV, showed the daily massive video data, the diversity of user interaction, the number of user behavior and the subsequent surge. Along with the "triple play" strategy to promote, and TV user needs constantly how to expand, and the effective use of large-scale data processing has become an urgent problem to be solved in this field. Because of the large data, search engine, the vigorous development of personalized recommendation technology, this problem has been paid attention to, and gradually derived some solutions. At present, the personalized recommendation system has been widely studied and applied. Mining can help users improve their interest, help users to establish the system of the portrait, helps to maintain the user attention to content, avoid The loss of related business users. The calculation method of the main recommendation system is divided into model construction based on neighborhood construction. Recommendation system model can accurately express the user interest based on the outstanding performance in the recommended effect, and the neighborhood construction relative to the more simple and based on good explanation. How to effectively combine the two model's strengths to jointly build a recommendation system model is a research focus of this paper. In addition, according to the business logic in the TV recommender system, because the TV is shared terminal, user interest in different time context conditions may be different, how to properly introduce the contextual conceptual modeling to enhance the effectiveness of the recommendation, but also the focus of this article. So, in this research, we first propose a short text based on LDA Recommendation algorithm. The algorithm is a topic model mining model based on the recommendation, the applications of text mining in the field of latent semantic model to the recommendation system, to accurately construct the user interest. The theme of the algorithm for video recommendation system users to watch the video and usually less sparsity of the data, do the special treatment, the original LDA algorithm on video for modeling into direct to video co-occurrence modeling and sampling calculation. This processing greatly solve the problem of data sparsity, and can effectively improve the accuracy of user interest mining. LDA topic model we introduce the short text and user viewing records two matrix into a low dimensional space, i.e. the user interest matrix (user topic), and video subordinate degree matrix (Theme - VIDEO). On the basis of accurate access to the user's interest, to solve the TV Recommended terminal sharing, we introduce time context information and build a collaborative filtering recommendation algorithm based on user interest. The first algorithm is a recommendation algorithm based on neighborhood, are recommended to video users with similar interests, context aware before the introduction of filtering when constructing the user interest recommendation strategy in the construction of the video is now in this process, adding context constraints, only the elements in the same time in the context of the construction of video collection video. The context information before filtering strategy effectively is introduced, which can be used to differentiate the user in different time, avoid not related to video construction one video co-occurrence. In addition, when the recall recommended list and final ranking, the re introduction of context aware after filtering for each recommendation strategy. Whether a video is recommended by weighting in the current environment, weighted is the basis for the user in the current context of the topics of interest distribution. The post filtering method can do a request for a list of recommended time based on user interest in the context of further screening, can greatly improve the recommendation effect. In order to recommend effect experiment model and we use the well-known TV recommendation platform, Hisense TV cloud platform real data sets, provide various contrast recommendation algorithm, and evaluated in various data evaluation index. Our method on the data set has a high recall rate and MAP, MRR and other indicators, significantly better than the other traditional recommendation algorithm and the context recommendation algorithm, and prove the validity of this method.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 白丽君 ,张永奎 ,赵辄谦;用户兴趣的反馈学习[J];电脑开发与应用;2003年02期
2 王杰;使图像的编辑更加容易[J];中文信息;1998年Z1期
3 王波,姚敏;基于信息抽取的匿名用户兴趣描述[J];华南理工大学学报(自然科学版);2004年S1期
4 董全德;;用户兴趣迁移模式与个性化服务[J];电脑知识与技术(学术交流);2007年17期
5 郑运刚;马建国;;基于分类的用户兴趣漂移模型[J];情报杂志;2008年01期
6 张涛;;基于浏览历史的用户兴趣提取模型[J];软件导刊;2009年06期
7 杨杰;陈恩红;;面向个性化服务的用户兴趣偏移检测及处理方法[J];电子技术;2009年11期
8 陈圣兵;李龙澍;纪霞;;多层次用户兴趣模式的动态捕捉[J];计算机工程与应用;2009年36期
9 郑晓健;庞淑英;何英;;一种面向主题的用户兴趣挖掘模型研究[J];昆明学院学报;2010年03期
10 花青松;刘海峰;胡铮;;基于基尼系数的用户兴趣分布模式度量方法[J];计算机工程;2012年22期
相关会议论文 前7条
1 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
2 孙静;郭奇;张志强;冯建华;;一种基于面向领域检索系统的用户兴趣获取方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 孙铁利;教巍巍;;基于马尔科夫模型的用户兴趣导航模型系统(英文)[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
4 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
5 李晓黎;史忠植;梁永全;刘福桃;;INTERNET网上一种识别用户兴趣的学习方法[A];第十六届全国数据库学术会议论文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用户兴趣表示研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 王勇;刘奕群;张敏;马少平;茹立云;;基于用户兴趣分析的网页生命周期建模(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
相关重要报纸文章 前1条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
相关博士学位论文 前9条
1 梁政;面向在线社交网络舆情的信息传播分析关键技术研究[D];国防科学技术大学;2014年
2 张召;在线论坛用户兴趣图谱发现与个性化信息推荐[D];华东师范大学;2012年
3 刘淇;基于用户兴趣建模的推荐方法及应用研究[D];中国科学技术大学;2013年
4 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
5 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
6 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
7 李东胜;基于兴趣与保护隐私的在线社区推荐技术研究[D];复旦大学;2012年
8 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年
9 姜邵巍;基于竞争关系的推荐技术研究[D];北京邮电大学;2014年
相关硕士学位论文 前10条
1 陈媛媛;用户兴趣图谱演化机制研究[D];武汉理工大学;2014年
2 梁润庭(Runting Leung);面向微博用户的兴趣识别算法的研究与实现[D];西南交通大学;2015年
3 俞忻峰;新浪微博的数据采集和推荐方案研究[D];南京理工大学;2015年
4 杨梅;基于树型网络的多源用户兴趣数据融合方法研究[D];四川师范大学;2015年
5 石光莲;基于形式概念分析的Folksonomy用户兴趣识别研究[D];西南大学;2015年
6 汤文清;微博用户的兴趣及性格分析[D];上海大学;2015年
7 梅佩;基于浏览内容的用户兴趣研究[D];北京化工大学;2015年
8 张少杰;基于用户兴趣的微博广告投放系统的设计与实现[D];山西大学;2015年
9 黄龙伟;基于蚁群算法的WEB日志用户兴趣路径研究[D];江西师范大学;2015年
10 方正;微博短文本分析技术研究及应用[D];电子科技大学;2014年
,本文编号:1499519
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1499519.html