融合时空信息的社交媒体事件检测方法研究

发布时间:2024-07-02 01:36
  社交媒体是拥有众多用户参与的新型在线媒体,近年来以推特为代表的社交媒体网站吸引了数以亿计的用户,现实社会中所发生的重大突发事件在社交媒体中会得到快速的反应与广泛的传播,因此社交媒体中包含着丰富的突发事件的相关信息。社交媒体中的事件检测方法为利用机器学习与自然语言处理等技术,从海量的社交媒体数据中寻找现实生活中所发生的突发事件的方法,有效的事件检测能让人们及时了解社会中所出现的热门事件信息,并帮助政府等机构及时应对社会事件并采取相关措施。对于现实生活中具有一定影响力的事件,事件相关的内容通常在社交媒体中会引入广泛讨论,因此现有社交媒体事件检测的一个基本思路是通过文本聚类发现事件相关的文本,再对文本聚类进行分析判断是否为突发事件。但是,现有研究存在两方面问题:1)对社交媒体的短文本流的文本聚类效果不佳;2)事件的特征提取与判定不够准确。针对以上问题,本文以通过时空信息获得更加准确事件特征的角度研究社交媒体事件检测方法,主要贡献概括为如下两方面:(1)提出基于融合相似度的在线密度聚类方法。在相似度计算方面,考虑到社交媒体中文本长度较短等特点,本文利用短文本流构建动态的单词关联空间,并基于该空...

【文章页数】:83 页

【学位级别】:硕士

【部分图文】:

图3-4DBSCAN算法伪代码

图3-4DBSCAN算法伪代码

第三章基于时空信息的文本在线聚类方法27图3-4DBSCAN算法伪代码由图3-4可知,DBSCAN的聚类过程为,首先对于空间中的所有点的Eps邻域进行检查,将其中包含点的数量与Minpts进行比较,若大于Minpts,则将该点标记为核心点,并创建以该点为核心对象的簇。之后,通过不....


图3-5在线DBSCAN聚类方法伪代码创建以点v为核心点的核心对象的流程为:首先,创建核心对象,将核心点的Eps邻域内所包含的所有推文中的信息更新到核心对象中;之后,判断核心点v是

图3-5在线DBSCAN聚类方法伪代码创建以点v为核心点的核心对象的流程为:首先,创建核心对象,将核心点的Eps邻域内所包含的所有推文中的信息更新到核心对象中;之后,判断核心点v是

电子科技大学硕士学位论文28图3-5在线DBSCAN聚类方法伪代码创建以点v为核心点的核心对象的流程为:首先,创建核心对象,将核心点的Eps邻域内所包含的所有推文中的信息更新到核心对象中;之后,判断核心点v是否位于其它簇中,若位于其它簇中,则将多个包含核心点v的核心对象合并为同一....


图4-1十四天内各地理实体比例的变化

图4-1十四天内各地理实体比例的变化

第四章基于时空的突发事件判定方法414.2总体框架通过第三章所介绍的在线聚类方法可以得到描述潜在事件的文本簇,为了从其中识别出真实的突发事件,首先需要对事件进行准确的定义。本节将首先描述对于事件的详细的定义,之后基于该定义说明突发地理实体与突发事件之间的关系,并介绍基于突发地理实....


图4-3地理实体China的频率随时间变化图

图4-3地理实体China的频率随时间变化图

第四章基于时空的突发事件判定方法45实体China为例,展示了以两小时为时间窗长度时,在14天内该地理实体的频率随时间变化的图像,可以看出在这段时间内存在一个较为明显的突发。图4-3地理实体China的频率随时间变化图从图4-3中可以看出,地理实体在突发时间段内有着相比于其它时间....



本文编号:3999493

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3999493.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b2e85***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com