社会媒体信息推荐关键技术研究
发布时间:2017-12-31 20:06
本文关键词:社会媒体信息推荐关键技术研究 出处:《哈尔滨工业大学》2017年博士论文 论文类型:学位论文
更多相关文章: 社会媒体 信息推荐 用户兴趣建模 主题模型 协同过滤
【摘要】:以微博等为代表的社会媒体逐渐成为一种新兴的信息传播载体和信息共享平台。社会媒体的广泛流行导致信息呈爆炸式增长,用户很难获取到真正有用的信息,进而引发诸如信息过载、内容碎片化等问题,给社会媒体的信息推荐研究带来了契机。社会媒体蕴含着大量的用户生成内容,社会媒体的信息推荐研究主要通过理解和分析用户生成内容,推断用户的偏好,为用户提供感兴趣的信息。具体而言,社会媒体信息推荐主要包含三个重要元素。其一是信息,即社会媒体信息推荐的客体,信息自身内容以及它和其它信息的关系,为量化用户的兴趣提供了依据。其二是用户,即社会媒体信息推荐的主体,挖掘用户兴趣,分析用户偏好,有助于进行精准推荐。最后,推荐算法将信息与用户联系起来,是社会媒体信息推荐的关键。本文的研究工作围绕上述三个重要元素。我们以微博为平台,充分利用微博上丰富的文本数据、用户的群体智慧等信息,结合深度学习和主题模型等方法,对社会媒体信息推荐的关键问题展开研究。本文的主要研究内容包括以下几方面:1.本文提出了基于主题注意力机制的微博标签获取方法,解决了被推荐信息的相关性问题。微博标签以主题或关键词的形式将相似内容或相关主题的微博组织起来。针对微博文本和标签存在用词差异以及特征稀疏性等问题,本文将微博标签获取问题转化成分类问题,提出利用长短时记忆网络学习微博文本的深层语义表示。为了突出微博主题的作用,通过注意力机制将主题模型与长短时记忆网络相结合,在微博标签获取任务上的结果相比其他基线方法有显著的提升。同时,融合主题注意力机制的长短时记忆网络模型比标准的长短时记忆网络在F值上结果提升7.4%,为后续的微话题推荐研究奠定了良好的基础。2.本文提出了基于影响因素相似度的微博流行度预测方法,解决了被推荐信息的重要性问题。在推荐信息时,不仅关注信息内容的相关性,同时还关注信息本身的价值,从海量的微博信息当中挖掘出高流行度的微博推荐给用户。针对发布者对流行度起决定性作用的现象,本文提出以用户为中心,基于影响因素相似度预测微博流行度。该方法主要思想是利用用户历史微博信息,根据语义和时间相似度排序,选择与当前用户待预测微博最相似的K个候选,将相似候选的加权平均流行度作为待预测微博的流行度。这种方法简单有效,并且能够以特征的形式融入当前最先进的有监督模型之中,进一步提升预测结果。3.本文提出了基于有监督主题模型的用户兴趣建模方法,实现了跨平台的用户信息互补和用户兴趣的精准建模。本文以消费兴趣为研究对象,利用用户在社会媒体上的信息推断用户的消费兴趣类别。针对跨平台数据标注获取困难的问题,本文提出通过挖掘用户发布的社会媒体与电商平台的链接痕迹,实现跨平台用户的链指。利用有监督主题模型对用户发布内容、用户关注关系以及用户在电商平台上的购买行为联合建模。在微博和京东商城跨平台的真实数据集上进行实验,本文提出的方法在用户消费兴趣建模上取得了显著优于基线方法的结果。同时,本文的方法能够自动地学习消费类别相关的词和社会媒体账户,该结果能够直接应用于其他任务中。4.本文提出了融合多元信息的微话题推荐模型,以缓解信息推荐的冷启动问题,提升推荐结果。本文提出的混合推荐模型将用户参与行为、用户微话题文本信息以及属性信息融合起来。该模型基于主题模型和协同过滤模型,更深层次结合文本信息,对用户和微话题之间的参与关系建立良好解释性。一方面通过协同过滤技术学习用户的偏好,另一方面利用主题模型建模用户的内容兴趣。经实验证明,本文提出的方法和当前最先进的混合推荐方法相比,能够显著地提升推荐性能。特别是在冷启动情况下,提升效果更加明显。总之,本文一方面致力于社会媒体信息推荐中的基础性问题,包括信息建模和用户兴趣建模,另一方面从信息推荐算法的角度,提出了融合多元信息的社会媒体信息推荐模型。本文的研究取得了一些成果,相信随着自然语言理解和信息推荐技术的不断发展,社会媒体信息推荐研究在未来会取得更大的突破。同时,社会媒体信息推荐研究的日渐成熟也将促进其他相关研究的发展。
[Abstract]:This paper studies the key problems of social media information recommendation by using micro blog as the platform , using rich text data in social media , mining user ' s interest and analyzing user preferences . This paper makes an experiment on the relationship between user ' s participation behavior , user ' s micro - topic text information and attribute information , which is based on topic model and collaborative filtering model .
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP391.3
【参考文献】
相关期刊论文 前5条
1 仲兆满;管燕;胡云;李存华;;基于背景和内容的微博用户兴趣挖掘[J];软件学报;2017年02期
2 孟祥武;刘树栋;张玉洁;胡勋;;社会化推荐系统研究[J];软件学报;2015年06期
3 扈维;张尧学;周悦芝;;基于社会化标注的用户兴趣挖掘[J];清华大学学报(自然科学版);2014年04期
4 李栋;徐志明;李生;刘挺;王秀文;;在线社会网络中信息扩散[J];计算机学报;2014年01期
5 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
相关博士学位论文 前1条
1 丁效;基于社会媒体的市场行情预测方法研究[D];哈尔滨工业大学;2016年
,本文编号:1361252
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1361252.html