面向短文本流的主题演化分析研究

发布时间:2021-03-27 00:17
  随着互联网的快速发展,微博、电子商务、论坛、微信等网络平台已经得到了广泛的应用,这些网络平台所产生的短文本信息都以数据流的形式动态产生和实时更新。快速演化的短文本数据流使得我们迫切需要一种行之有效的分析工具来实时监测短文本数据流中产生的主题及其演化过程,这对舆情疏导、社会网络分析、热点事件挖掘、新兴话题追踪等意义重大。面向短文本数据流的主题演化分析是抽取短文本数据流主题及其演化过程的重要手段。这种方法可以实时分析社交媒体上的热点事件,从而协助监测部门及时做出响应措施。但是,由于短文本流的文本长度较短、用语不规范等特点,使得传统主题演化分析方法面临以下四个问题:(1)难以对高冗余、高噪音的海量短文本流进行有效管理,存储和挖掘时空开销较大;(2)现有短文本主题建模聚合方法通常需要外部辅助信息,泛化能力较差;(3)由于短文本的长度有限,上下文特征非常稀疏,使得面向短文本的主题抽取效果不佳。(4)现有的主题演化分析方法主要针对新闻、网页这样的长文本,仅采用文本特征度量主题间的关联性。而短文本长度短,且文本特征不足,仅依靠文本特征很难准确度量主题间的关联关系。针对上述问题,本文构建了一个面向短文... 

【文章来源】:武汉大学湖北省 211工程院校 985工程院校 教育部直属院校

【文章页数】:139 页

【学位级别】:博士

【部分图文】:

面向短文本流的主题演化分析研究


基于LLT框架的短文本数据流存储示例

面向短文本流的主题演化分析研究


短文本流统计分析信息

面向短文本流的主题演化分析研究


多样性参数对高质量短文本采样的影响


本文编号:3102507

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3102507.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户81714***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com