当前位置:主页 > 管理论文 > 移动网络论文 >

微博兴趣社区发现及其热议话题检测技术研究

发布时间:2019-08-06 16:52
【摘要】:微博相比于以往任何一种网络传播媒介,具有更强的原创性、快捷性、交互性,为每一个网络用户都提供了自我展示的平台,因而迅速吸引了大量用户。然而作为一种新型媒体,在其快速发展的同时,也给网络舆情带来了严峻的挑战。微博兴趣社区是微博网络中的一种非实体社区,其内部成员往往具有相似的兴趣爱好。话题在社区内部被优先收看且容易引起共鸣,使得其更容易被快速、大范围地传播,所以社区内热议话题往往是大规模舆论产生的根源。由以上分析可知,发现微博兴趣社区并检测兴趣社区内的热议话题对网络舆情的高效监管具有重要意义。目前,微博兴趣社区发现技术和热议话题检测技术主要还面临以下问题:(1)现有的兴趣社区发现方法大都假定用户兴趣固定不变,忽略了微博用户兴趣的漂移特性带来的影响;(2)现实世界中的社区大都是重叠的,而现有的微博社区发现方法对重叠社区检测的准确性较低;(3)热议话题检测技术主要面临微博文本短导致的数据稀疏性问题,数据的稀疏性会对特征空间的合理性和充分性造成严重的影响。本文针对以上问题展开研究,主要贡献如下:1.提出了一种基于遗忘曲线的微博用户兴趣模型。用户兴趣并非一成不变,它是一个外界刺激作用下渐变的过程,而且,用户关注某信息的时间距离当前时间越远则该信息越容易被遗忘,其对用户当前兴趣的影响也就越小;用户关注某一领域的信息越多则印象越深刻,并进而会加深对该领域的兴趣度;这两点与人类对知识逐渐遗忘和重复学习强化记忆的过程具有高度相似性。因此,本文以人类记忆学中的遗忘曲线为基础,提出了一种微博用户兴趣模型。实验表明,该模型能较好地预测微博用户兴趣,召回率可达85.3%。2.提出了一种综合用户兴趣与链接关系的微博社区发现算法。利用基于遗忘曲线的兴趣模型求解用户兴趣得到用户兴趣相似度矩阵,将用户兴趣相似度矩阵映射为虚拟兴趣网并求该网络的链接相似度,然后结合微博用户的真实关注关系得到总的链接相似度。为了将链接相似度用于社区发现,推广了传统的Ward层次聚类算法,使之适用于具有相似性度量的任意对象,并将其用于社区发现。实验表明,该算法不需要先验知识就能准确地发现微博社区,准确率可达83.4%。3.提出了一种基于评论树的微博社区热议话题检测方法。首先在分析微博文本特点的基础上设计了一种垃圾微博的过滤算法;然后针对微博数据稀疏性这一问题,利用社区内部联系紧密的特性,提出了微博评论树的概念和一种话题热度评价模型;最后基于以上两点提出了一种微博社区热议话题检测方法。实验表明,评论树的建立使得话题检测系统性能提高了3%。
【学位授予单位】:解放军信息工程大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092

【参考文献】

相关期刊论文 前10条

1 蔡波斯;陈翔;;基于行为相似度的微博社区发现研究[J];计算机工程;2013年08期

2 曾东红;汪涛;严水发;赖慧芳;;一种基于指数遗忘函数的协同过滤算法[J];科技广场;2013年07期

3 王卫平;范田;;一种基于主题相似性和网络拓扑的微博社区发现方法[J];计算机系统应用;2013年06期

4 闫光辉;舒昕;马志程;李祥;;基于主题和链接分析的微博社区发现算法[J];计算机应用研究;2013年07期

5 王琳;冯时;徐伟丽;杨卓;王大玲;张一飞;;一种面向微博客文本流的噪音判别与内容相似性双重检测的过滤方法[J];计算机应用与软件;2012年08期

6 原福永;冯静;符茜茜;曹旭峰;;一种降低微博僵尸粉影响的方法[J];现代图书情报技术;2012年05期

7 郑斐然;苗夺谦;张志飞;高灿;;一种中文微博新闻话题检测的方法[J];计算机科学;2012年01期

8 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期

9 平亮;宗利永;;基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J];图书情报知识;2010年06期

10 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期



本文编号:2523632

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2523632.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fcdaa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com