网络舆情突发事件检测与追踪关键技术研究
发布时间:2017-08-08 12:22
本文关键词:网络舆情突发事件检测与追踪关键技术研究
更多相关文章: 子话题划分 层次话题模型 事件关系识别 突发性检测 情感过滤
【摘要】:在互联网技术飞速发展并日益成熟的今天,网络成为我们日常生活中不可或缺的一个重要部分。加之平板电脑与智能手机等移动互联网终端设备日益普及,使得网民能够随时随地地融入互联网世界,随着人们对网络的依赖程度也逐渐加深,互联网成为信息传播的主要途径之一。当网络突发事件发生后,更多的人习惯于从互联网获取相关信息,尤其是通过微博、微信、博客等网络平台获取所谓的“事实真相”并进行转发。然而,网民在网络上转发这些信息时往往加载自己的主观情感,这种由现实事件诱发的个体情感也比较容易引起网民的共鸣,由此可见,网络对社会舆论有放大作用。如何从互联网中捕捉到网络舆情突发事件,从而合理地控制和引导舆论发展方向,减少突发事件造成的不必要危害,成为摆在人们面前的重要课题。由此可见,为网络舆情事件的应急处理提供数据支持和技术手段,这一研究课题具有积极的现实和理论意义。 目前,国内外对网络舆情突发事件的研究已经有了很大的进展,相关的专家学者从社会科学、心理学、信息科学等方面对网络突发事件的演化机理、发生、发展规律进行过深入地探讨,但仍存在以下几个亟待解决的问题: (1)互联网环境下,信息碎片化传播致使网民难以获取全面的信息 互联网环境下,网民在传播信息的同时追求个性,加之网民知识结构、年龄结构、地域结构的差异,致使他们对同一事件的关注点不同,选择传播的信息点和信息量也不尽相同,最终导致信息的碎片化传播。信息碎片化传播导致网民难以获取全面的信息,反而获取的是离散的、片面的信息碎片。片面的信息也给别有用心者提供了肆意发挥、捏造事实的空间,在一定条件下极易演化为网络舆情。 (2)平面话题模型难以描述种子事件和衍生事件之间的语义联系,,导致相关事件检测困难 现有相关事件检测方法多利用核心词作为事件关联的依据,该方案容易探测种子事件和衍生事件之间的关系,而衍生事件之间是否相关却难以探测。尤其是当衍生事件均与种子事件密切相关时,种子特征却成为衍生事件间关联检测的干扰。如何消除种子事件带来的干扰,探测种子事件和衍生事件之间的关联关系,是本文拟解决的关键问题。 (3)现有方法忽略了网民情感对事件演化和传播的影响,导致突发事件检测准确率降低 信息传播的过程实质上是网民情感交流和碰撞的过程。突发事件发生后,网民从互联网获取信息的同时会传播信息,在信息传播的过程中他们往往附加恐慌、愤怒或其他负面情绪。在信息传播的过程中,网民情感得到放大和共鸣,最终导致群极现象,刺激网络舆情事件爆发。 针对上述问题,本文将子话题划分、相关事件识别、突发事件检测三个方面作为本文的研究内容,主要工作如下: (1)提出一种基于改进蚁群聚类算法的子话题划分策略 本文认为,当一个话题被划分为若干个子话题时,划分过程中话题的语义损失度应保持最小。基于上述思想,本文首先将话题划分为句子的集合,以句子为单位构建它们的特征空间;以此为基础构造话题聚类语义损失度函数,结合sigmoid函数构建语义相似度计算方法,改进蚁群聚类算法,达到子话题划分的目的;最后,通过直接评价和间接评价验证本文方法的可行性。 (2)提出一种基于实体依赖的相关事件识别方法 现有研究方法仍然是借鉴篇章关系分析方法,却没有注意到种子事件、衍生事件之间的关系,尤其是衍生事件之间的关系推理仍鲜有涉及。尤其忽略了衍生事件间事件关系识别过程由于种子特征带来的干扰,导致衍生事件相关检测准确率降低的问题。为此,本文在子话题划分的基础上,将话题特征划分为种子特征和衍生特征两个维度,以此为基础构建层次事件模型,从种子特征和衍生特征两个维度构建文档间的事件关联线索。最后,引入依存句法分析和文档内事件关系线索,用于文档间事件关系线索的扩充,达到相关事件识别的目的。 (3)提出一种基于用户情感的在线突发事件识别方法 自移动终端接入互联网以来,微博、微信等媒体平台迅速发展。而在这些平台中,网络突发事件大大增加,其突发性、爆炸式增长和多点爆发等特点使得对于该类事件的检测和追踪带来困难。针对这一问题,本文提出了一种融合用户情感的突发事件检测方法。本方法为话题构造了层次模型,并且可以依靠时序驱动的方式不断的调整模型的特征项,以达到在线识别突发事件的目的。同时,通过对用户情感的深入研究,分析网络用户对突发事件所持有的态度,将包含群体负面情感的话题视为突发话题,以此过滤掉网络中充斥的大量生活、娱乐等热点事件而非突发事件。
【关键词】:子话题划分 层次话题模型 事件关系识别 突发性检测 情感过滤
【学位授予单位】:山东师范大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.1;TP18
【目录】:
- 摘要6-8
- Abstract8-11
- 第1章 绪论11-23
- 1.1 研究背景和意义11-13
- 1.1.1 理论意义11-12
- 1.1.2 应用价值12-13
- 1.2 研究现状13-18
- 1.2.1 话题检测与追踪国际研究现状13-17
- 1.2.2 话题检测与追踪国内研究现状17
- 1.2.3 突发话题检测相关研究17-18
- 1.3 研究内容及本文贡献18-20
- 1.3.1 研究内容18-19
- 1.3.2 本文贡献19-20
- 1.4 本文的组织结构20-23
- 第2章 基于改进蚁群聚类算法的子话题划分策略23-35
- 2.1 引言23
- 2.2 研究现状23-24
- 2.3 蚁群聚类算法24-25
- 2.4 改进的蚁群聚类算法25-27
- 2.4.1 损失函数定义25-26
- 2.4.2 概率转换函数定义26-27
- 2.5 基于改进蚁群算法的子话题划分27-28
- 2.6 实验分析28-33
- 2.6.1 实验语料28
- 2.6.2 评测指标28-29
- 2.6.3 实验结果及分析29-33
- 2.7 小结33-35
- 第3章 基于实体依赖的相关事件识别方法35-47
- 3.1 引言35
- 3.2 研究现状35-37
- 3.2.1 国际研究现状35-36
- 3.2.2 国内研究现状36-37
- 3.3 常用事件关系识别方法37-38
- 3.3.1 基于模式匹的事件关系识别37
- 3.3.2 基于特征分析的事件关系识别37-38
- 3.4 问题定义38
- 3.4.2 层次事件模型定义38
- 3.5 事件关系推理线索集构建38-43
- 3.5.1 特征空间定义38-40
- 3.5.2 初始关系线索集构建40
- 3.5.3 问题分析40-43
- 3.6 事件关系推理43
- 3.7 实验结果及分析43-46
- 3.7.1 实验语料43
- 3.7.2 评价指标43-44
- 3.7.3 实验流程44-45
- 3.7.4 实验结果及分析45-46
- 3.8 本章小结46-47
- 第4章 基于用户情感的在线突发事件识别研究47-59
- 4.1 引言47-48
- 4.2 研究现状48-49
- 4.3 问题分析49-52
- 4.4 基于情感过滤的网络突发事件预判52-55
- 4.4.1 新事件探测52-53
- 4.4.2 基于时序驱动的突发性评估53
- 4.4.3 融合情感过滤的突发话题检测53-55
- 4.5 实验及结果分析55-58
- 4.5.1 实验语料55-56
- 4.5.2 评价指标56
- 4.5.3 实验流程56-57
- 4.5.4 实验结果分析57-58
- 4.6 本章小结58-59
- 第5章 网络舆情分析系统59-67
- 5.1 网络舆情突发事件预判系统设计方案59-61
- 5.1.1 系统整体设计59
- 5.1.2 系统设计思路59-60
- 5.1.3 网络舆情突发事件预判流程60-61
- 5.2 网络舆情预判系统主界面61-66
- 5.2.1 服务器端系统主要界面62-65
- 5.2.2 客户端系统主要界面65-66
- 5.3 本章小结66-67
- 第6章 总结与展望67-69
- 6.1 总结67-68
- 6.2 进一步工作68-69
- 参考文献69-78
- 攻读博士学位期间取得的成果及参与的课题78-79
- 致谢79-80
【参考文献】
中国期刊全文数据库 前10条
1 马彬;洪宇;杨雪蓉;姚建民;朱巧明;;基于语义依存线索的事件关系识别方法研究[J];北京大学学报(自然科学版);2013年01期
2 涂眉;周玉;宗成庆;;基于最大熵的汉语篇章结构自动分析方法[J];北京大学学报(自然科学版);2014年01期
3 马彬;洪宇;杨雪蓉;姚建民;朱巧明;;基于推理线索构建的事件关系识别方法[J];北京大学学报(自然科学版);2014年01期
4 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期
5 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
6 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
7 石晶;戴国忠;;基于PLSA模型的文本分割[J];计算机研究与发展;2007年02期
8 李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;2003年17期
9 刘宗田;黄美丽;周文;仲兆满;付剑锋;单建芳;智慧来;;面向事件的本体研究[J];计算机科学;2009年11期
10 洪宇;张宇;范基礼;刘挺;李生;;基于子话题分治匹配的新事件检测[J];计算机学报;2008年04期
本文编号:639968
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/639968.html