基于主题模型的突发话题推荐算法研究

发布时间:2025-01-10 20:11
  随着互联网的普及,Facebook,Twitter,微博等社交网络平台凭借其方便快捷的特点迅速普及,逐渐成为传统媒体以外的一个重要的信息来源。许多用户使用社交平台来表达自己的感受,与朋友分享感兴趣的内容与话题。同时社交网络上许多突发性话题,往往会在网络社交平台上发布,借助用户的好友转发机制迅速传播,引起广泛的社会共鸣,进而产生巨大的社会影响。人们面临的问题不仅是如何在海量的互联网信息跟踪突发事件和舆情走向,还需要从中找到自己真正感兴趣的实时话题信息,因此,一个能检测突发事件并推送给感兴趣用户的推荐算法能够带来更好的用户体验。鉴于以上需求,本文在前人研究的基础上,以新浪微博为研究平台,改进了传统话题检测技术并提出了一种基于主题模型的微博推荐方法。本文主要工作有以下三个部分:首先,根据新浪微博中突发事件发生的突发特征,使用突发词特征来检测微博中的突发话题,并使用LDA主题模型获得突发微博的主题概率分布。其中,使用相对词频,词频增长率,突发权重三个特征来筛选突发词,将存在突发词的微博标记为突发微博,同时对突发微博进行主题建模。实验证明实际采集的微博文本数据不仅提高了话题检测效率,还更好地降低了...

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

图3.6对比实验图

图3.6对比实验图

会慘杂着大量的无关紧要的一些话题,噪声较大,导致查准率非常大时,查准率会不断増大,而查全率会相应的降低。当阈值为45的准率都达到61%,对应效果最好,因此突发词阈值选取45。比实验为文本为中心的突发词聚类方法作为baseline方法,分别对比查准,将通过算法获得的推荐....



本文编号:4025386

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4025386.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户16452***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com