面向微博突发事件发现的自适应社区检测算法研究及系统实现
本文关键词:面向微博突发事件发现的自适应社区检测算法研究及系统实现,,由笔耕文化传播整理发布。
【摘要】:伴随着社交媒体的快速发展,微博类应用已经成为传统媒体以外的一个重要的信息来源。如何及时且准确地从微博数据流中发现突发事件信息,已成为数据挖掘领域近些年来的研究热点之一。为了从海量噪声数据中过滤出稀疏的事件信号,学术界提出了很多方案来描述和检测突发特征,并对这些特征进行聚类以得到完整的事件信息。然而,在实时更新的微博流场景中,需要以有限的时空开销来生成事件信息,所以传统的静态聚类方案不能满足需求。本文针对这一问题,提出用突发特征网络中的社区结构来描述事件,且以历史事件为基础生成最新事件的信息,旨在减少实时检测突发事件的时空开销,并提高事件发现的准确度。本文的主要内容和贡献如下:第一,提出了一个面向带权网络的自适应社区检测算法。该算法基于无权动态网络下的QCA社区检测算法,采用了模块度局部优化的思路。在带权网络出现动态变化的情况下,该算法能够对历史的社区结构进行自适应调整。基于作用力的概念,可以分析得知网络变化对于结点移动趋势的全局影响,从而避免了不必要的网络调整开销。在此基础上,再以模块度优化为目标,对不稳定的社区结构进行局部调整。第二,提出采用带权网络模型对突发单词的重要性和共现性建模,并以词图网络中的社区结构来描述事件信息。此外,本文基于带权网络提出了权重强度的概念,以描述网络中局部子图的重要性,并据此推导出带权网络下的模块度度量公式。第三,提出了一个微博突发事件在线检测系统的实现方案。该方案采用特征优先的策略,结合预处理和突发性估计的结果来构建带权词图模型,应用自适应社区检测算法来发现单词网络中的事件信息。通过实验可以证明,利用该系统方案能够快速且准确地发现突发事件。
【关键词】:事件检测 社区检测 动态网络 数据挖掘 自然语言处理
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092;TP391.1
【目录】:
- 摘要6-7
- Abstract7-10
- 第1章 绪论10-15
- 1.1 课题的研究背景和意义10-11
- 1.2 微博事件检测研究现状11-13
- 1.2.1 文档优先与特征优先11-12
- 1.2.2 回顾式事件和新事件发现12-13
- 1.3 本文的主要内容和结构安排13-15
- 第2章 特征优先的微博突发事件检测15-27
- 2.1 算法框架15-16
- 2.2 特征检测16-21
- 2.2.1 概率生成模型16-17
- 2.2.2 指数平滑预测17-19
- 2.2.3 频域分析19-20
- 2.2.4 总结20-21
- 2.3 事件生成21-25
- 2.3.1 基于向量空间模型与文档聚类的事件生成21-22
- 2.3.2 基于网络模型与社区检测的事件生成22-25
- 2.3.3 总结25
- 2.4 事件检测的评价标准25-26
- 2.5 本章小结26-27
- 第3章 面向带权动态网络的自适应社区检测算法27-53
- 3.1 带权动态网络模型27-30
- 3.1.1 模型定义及符号标记27-28
- 3.1.2 权重强度28-29
- 3.1.3 调整Modularity指标29-30
- 3.2 QCA算法30-32
- 3.2.1 符号标记及目标函数30
- 3.2.2 算法流程30-31
- 3.2.3 扩展至带权动态网络31-32
- 3.3 自适应社区检测算法32-41
- 3.3.1 基于作用力概念的推论及证明33-36
- 3.3.2 算法流程36-41
- 3.4 社区检测结果的评价方法41-42
- 3.5 实验结果42-52
- 3.5.1 实验集42-43
- 3.5.2 自适应社区检测算法性能分析43-50
- 3.5.3 自适应社区检测算法结果示例和分析50-52
- 3.6 本章小结52-53
- 第4章 微博突发事件在线检测系统实现53-72
- 4.1 系统框架53-54
- 4.2 模块实现54-64
- 4.2.1 预处理54-55
- 4.2.2 突发性估计55-59
- 4.2.3 词图构建59-61
- 4.2.4 事件生成61-64
- 4.3 实验结果64-71
- 4.3.1 实验集64
- 4.3.2 事件发现性能分析64-67
- 4.3.3 事件发现结果展示67-71
- 4.4 本章小结71-72
- 结论72-73
- 致谢73-74
- 参考文献74-78
- 攻读硕士学位期间发表的论文及科研成果78
【相似文献】
中国期刊全文数据库 前10条
1 关治洪;张皓;朱茹;;一类时空切换动态网络的稳定性[J];华中师范大学学报(自然科学版);2006年01期
2 郑海青;井元伟;刘晓平;;一类具有多种耦合时滞的复杂动态网络的牵制同步[J];控制与决策;2010年11期
3 李涛;于晓楠;;延迟复杂动态网络的稳定性研究[J];网络安全技术与应用;2011年08期
4 高琳;杨建业;覃桂敏;;动态网络模式挖掘方法及其应用[J];软件学报;2013年09期
5 陈关荣;;复杂动态网络环境下控制理论遇到的问题与挑战[J];自动化学报;2013年04期
6 段文勇;蔡晨晓;邹云;尤静;;时滞耦合和非时滞耦合的奇异复杂动态网络之同步性准则(英文)[J];控制理论与应用;2013年08期
7 于苹,张尧弼,虞春宜;使用动态网络提高分布应用的性能[J];计算机工程与应用;2002年03期
8 王得蓉;;试论能源管理计算机动态网络体系的建设[J];资源节约与环保;2010年03期
9 郑宏珍,胡屏;动态网络需要动态的安全策略[J];中国信息导报;2002年01期
10 王学光;;基于动态网络影响扩散问题研究[J];计算机科学;2012年06期
中国重要会议论文全文数据库 前10条
1 朱陈平;孔辉;李莉;古志鸣;熊诗杰;;耦合演化动态网络的稳定效率与反选举人模型[A];2009年第五届全国网络科学论坛论文集[C];2009年
2 徐式蕴;杨莹;;一类复杂动态网络的全局鲁棒H_-/H_∞同步[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
3 卢剑权;Daniel W.C.Ho;曹进德;;脉冲动态网络的一个统一同步标准[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
4 刘斌;雷鸣;余沛;冯春;;具有多藕合时滞的不确定脉冲动态网络的鲁棒指数同步[A];2006全国复杂网络学术会议论文集[C];2006年
5 汪小帆;苏厚胜;;复杂动态网络控制研究进展[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
6 张海涛;陈志强;周涛;;二阶动态网络的模型预测一致性控制策略研究[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
7 廖丙连;蒋国平;;具有不同拓扑结构的时滞耦合复杂动态网络同步控制[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 陈姚;吕金虎;;复杂动态网络的有限时间同步[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
9 李常品;陈关荣;周天寿;;带非线性内部耦合函数的复杂动态网络的同步注记[A];第二届全国复杂动态网络学术论坛论文集[C];2005年
10 雷晓;蒋国平;张跃;;复杂动态网络不稳定平衡点的输出反馈牵制控制[A];第24届中国控制与决策会议论文集[C];2012年
中国重要报纸全文数据库 前1条
1 周海龙;秦电:动态网络图实时演示检修进度[N];华北电力报;2005年
中国博士学位论文全文数据库 前6条
1 郭晓永;复杂动态网络的自适应同步控制研究[D];西安电子科技大学;2013年
2 陈卓;动态网络上的演化博弈研究[D];上海交通大学;2012年
3 张丽丽;具有相似节点的复杂动态网络镇定与同步控制研究[D];广东工业大学;2014年
4 仲伟松;几类复杂动态网络的若干动力学问题的研究[D];东北大学;2012年
5 朱会宾;复杂动态网络的同步控制及应用[D];江南大学;2011年
6 朱牧;复杂网络中社区发现关键技术研究[D];中国矿业大学;2014年
中国硕士学位论文全文数据库 前10条
1 张阳扬;面向微博突发事件发现的自适应社区检测算法研究及系统实现[D];西南交通大学;2015年
2 顾瑜;随机噪声环境下的复杂动态网络外部同步[D];南京邮电大学;2013年
3 曹素雯;基于牵制控制的时延复杂动态网络外部同步研究[D];南京邮电大学;2013年
4 韦庆阳;随机耦合的复杂动态网络控制[D];南京邮电大学;2013年
5 杨建业;动态网络拓扑结构变化的多角度度量[D];西安电子科技大学;2013年
6 王慧丽;动态网络中多维意见的传播模型研究[D];大连理工大学;2011年
7 贾琳;复杂动态网络的同步和能源结构调控分析的研究[D];江苏大学;2009年
8 李芳;复杂动态网络与混沌系统的同步[D];江南大学;2006年
9 宁方清;一类非恒等节点的复杂动态网络同步化分析[D];东北大学;2010年
10 廖丙连;具有不同拓扑结构的复杂动态网络同步控制研究[D];南京邮电大学;2011年
本文关键词:面向微博突发事件发现的自适应社区检测算法研究及系统实现,由笔耕文化传播整理发布。
本文编号:298093
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/298093.html