基于微博的事件演化分析及摘要抽取方法研究
发布时间:2021-03-23 11:29
如今微博平台已经成为了实时信息的传播的重要媒介,每当一个热门事件发生时,微博平台如Twitter会在第一时间涌现出大量与该事件相关的推文,并且融入到微博的海量信息当中。由于微博数据具有低密度性和高冗余性的特点,使得用户很难通过搜索浏览的方式快速准确的了解该热点事件的发生及演化过程。因此在海量的微博数据中,如何快速掌握一个热点事件的演化过程并以简明扼要的摘要形式呈现给用户,成为了社交网络分析领域的一个研究热点。然而微博数据的简短、不规范和规模庞大等特殊性,使得传统的适用于长文本(如新闻报道)话题检测与追踪技术不再适用。本文以Twitter平台为基础,提出了一种基于微博事件的演化分析及摘要抽取方法,该方法按时间线形式呈现事件演化形成的各个演化阶段的摘要。本文主要研究工作如下:第一,提出基于关键词共现图的演化阶段检测算法。由于随着微博事件的动态发展,会演化出不同的阶段。所以该算法以Twitter事件的推文数据流为输入,基于关键词及其共现关系构建关键词共现图;然后基于重叠社团划分算法得到关键词社团,其中一个社团对应一个演化阶段,然后推文数据集基于社团中的关键词进行文档聚类得到演化阶段推文簇,即...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
蛋白质网络实例图
达维台风事件社团划分部分结果图
本文编号:3095711
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
蛋白质网络实例图
达维台风事件社团划分部分结果图
本文编号:3095711
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3095711.html
最近更新
教材专著