当前位置:主页 > 管理论文 > 移动网络论文 >

基于TIN-LDA模型的微博推荐方法研究及应用

发布时间:2020-10-11 23:19
   随着时代的发展,微博作为网络资源中共享、交流的社交与服务媒介平台,逐渐融入到人们的日常生活中。微博平台在为网络用户的自由言论与互动提供一个相对稳定安全环境的同时,也为用户提供一个资源互换的空间。微博用户与用户、资源之间产生了大量的显性或隐性商业化的价值信息,可供用户之间进行资源互换。商业用户主要通过微博用户的兴趣标签、关注内容等有价值的信息,挖掘微博用户的兴趣,从而达到准确推荐商品的目的。在微博大数据环境影响下,如何根据用户需求精确实现微博商品、博文推荐,已经成为当前互联网大数据研究的热点。商家在对用户进行推荐时,通常使用主题模型、协同过滤等传统的数据挖掘算法与推荐算法。但传统的数据挖掘方法在进行挖掘有价值的微博信息时,常容易出现数据歧义、语义模糊、信息冗余等问题。为避免上述问题的发生,本文将微博交互信息作为基础数据源,提出TIN-LDA模型与微博个性化混合推荐算法,以提高挖掘微博用户兴趣与微博推荐的准确性。本文的主要研究内容如下:(1)基于微博时效性与交互性特点,构建TIN-LDA模型挖掘微博用户兴趣。由于用户显性兴趣信息和隐性兴趣信息之间存在交互性、相似性、时效性,因此在不同的环境与时间段下,微博用户兴趣信息呈现出不同的类型特点。为全面挖掘微博用户兴趣,本文根据微博的时效性推断微博用户动态兴趣取向,根据微博交互性推断微博用户兴趣层次取向,以此构建TIN-LDA模型挖掘微博用户扩展属性上的兴趣主题与主题词,该方法展现了微博用户潜在兴趣的层次与动态变化。本文以主题质量、困惑度为TIN-LDA模型的评价标准,实验结果表明TIN-LDA微博用户兴趣模型能更为精确的挖掘微博用户的兴趣。(2)基于传统推荐算法,给出微博个性化混合推荐。由于微博兴趣推荐时容易受到微博文本内容稀疏性的影响,基于内容的传统推荐算法和协同过滤推荐算法难以实现微博的个性化推荐。因此本文基于挖掘微博文本信息中“多源相关信息有利于提升用户推荐质量”这一假设,结合微博多源数据的多样性特点,提出基于KTL推荐算法;结合微博多源数据的个性化特点,提出融合KTL与协同过滤的微博个性化混合推荐算法。通过F-measure实验结果表明,相较于单一的基于内容的微博推荐或单一的基于协同过滤的微博推荐,微博个性化混合推荐算法能够获取更好的效果。(3)构建微博用户兴趣平台,可视化展示微博推荐TOP-K。考虑海量数据的场景,使用SSM框架、redis和ngnix等技术,实现微博用户信息数据源的分布式、并发处理及可视化展示。同时,将微博个性化混合推荐算法与echart可视化界面相结合,应用于微博用户兴趣与商业推荐的结果展现。通过构建微博用户兴趣平台展示推荐TOP-K,平台的展示结果对于挖掘商业化的信息具有一定的价值。图[20]表[6]参[84]
【学位单位】:安徽理工大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.3;TP393.092
【部分图文】:

模型图,模型,主题,文档


存在多个混合主体,而且文章中每个主题都有着对应的词的概率分布,可以借助于极大??值算法来完成PLSA模型的构建。同时Hof?Maim也认为,这便是真正意义层面的主题??模型,其模型如图1所示。??该模型以数学统计为基础,对文档中不同位置上的词进行概率计算。在一个完整的??文档集中,其每篇文档d之下的每个词V,分成三步来生成:(1)借助于iY必先验概??率,择选其中的一篇文档A?(2)再借助于P问勿概率,得到主题二(3)再以??概率,得到单词w。因此在‘文档的第w篇中的词的概率如下公式5所示:??尸卜K)?=?I?Z)*作?K))?=?m)?(5)??9??

模型图,模型,主题,主题分布


现的概率也并非一致:不同文档的主题概率,以及主题中的词都属于Dirichlet分布并呈??现出独立性[7Q]。此为,LDA模型还引入了词袋模型假定,即.?在具体模型之中,对词汇??的次序不加考虑,仅仅注重他们出现频次的分析,LDA模型如图2所示。??LDA模型主要是使Gibbs抽样对参数进行估计。Gibbs抽样实现起来较为容易,且??在大规模预料中得到广泛应用。Gibbs的主要思想是不断釆用条件分布来加以抽样,使??得抽象结果更加与全概率分布相近。Gibbs在LDA模型中的抽样公式如公式7所示:??P{zt?=?k?|?z,?W)?=?(?l'rai,?+ak)/(X,inkmJ?+ak))*{n'kJ?+/S,)/(^,(K,?+?fi,))?(7)??Gibbs抽样是构建LDA模型的重要基础。LDA模型的训练过程,是借助于Gibbs抽??样算式,对文档中的每个词的主题进行迭代抽样,从而预测新文档的主题分布[71]。该训??练流程的步骤为:??(1)

协同过滤,物品,用户群


第2章相关技术与方法??使用了不同物品之间的相关性,而非不同用户之间的相关性。基于物品的协同过滤如下??图3所示:??n?^?0??物口口?1??用户1?J??0?IT!?W??r ̄^l??I?用户?3??J?J??LL??物品2??用户2??图3基于物品的协同过滤??Figure?3?Item-based?collaborative?filtering??在3图中,如果1、2两个用户,对两个物品,即物品1与物品2产生过行为。这??样,就能将两个物品纳入相似物品。即所有对1物品有了行为的用户,那么也会对2物??品产生行为。所以,如果用户3对1物品产生行为,那么就能向其推荐物品2。??但协同过滤算法缺乏一定的个性化,其推荐结果主要是按照目标用户阅读历史数据??来进行,很难展现出同类用户群、诸多目标用户群与类似用户群兴趣的差异,这就使得??推荐结果缺乏个性化。在构筑相似用户群之前,若A,B两用户所浏览微博内容基本一??致,则A,B用户便被纳入到同一各类似用户群,用户群可以获得一致的推荐结果。可??实际生活中他们兴趣并不一致
【参考文献】

相关期刊论文 前8条

1 张林;钱冠群;樊卫国;华琨;张莉;;轻型评论的情感分析研究[J];软件学报;2014年12期

2 高明;金澈清;钱卫宁;王晓玲;周傲英;;面向微博系统的实时个性化推荐[J];计算机学报;2014年04期

3 谢昊;江红;;一种面向微博主题挖掘的改进LDA模型[J];华东师范大学学报(自然科学版);2013年06期

4 杨长春;俞克非;叶施仁;严水歌;丁虹;杨晶;;一种新的中文微博社区博主影响力的评估方法[J];计算机工程与应用;2012年25期

5 王爱国;李廉;杨静;陈桂林;;一种基于Bayesian网络的网页推荐算法[J];山东大学学报(工学版);2011年04期

6 李涛;王建东;叶飞跃;冯新宇;张有东;;一种基于用户聚类的协同过滤推荐算法[J];系统工程与电子技术;2007年07期

7 盖杰,王怡,武港山;潜在语义分析理论及其应用[J];计算机应用研究;2004年03期

8 李静梅,孙丽华,张巧荣,张春生;一种文本处理中的朴素贝叶斯分类器[J];哈尔滨工程大学学报;2003年01期



本文编号:2837270

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2837270.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户00b51***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com