一种基于正规树模式匹配的复杂事件检测方法
发布时间:2017-09-18 19:11
本文关键词:一种基于正规树模式匹配的复杂事件检测方法
【摘要】:随着大数据时代的到来,来自社交网络、金融数据管理、网络监控等各种实时系统的流数据处理需求越来越多、也越来越复杂。这种大数据不仅具有数据量大、数据组织与语义复杂的特点,而且其中有价值的数据比较少。如何从海量且复杂的流数据中,高效地分析和处理这种价值密度低的数据,是大数据处理技术发展所面临的问题。相当多的流数据处理可以抽象为事件流的处理,从而使得流数据查询技术可以用于复杂事件检测,使得各种流数据查询模式可以用于描述复杂事件的模式。于是,发展描述能力更强的事件模式,提高事件检测效率的模式匹配算法已经成为解决大数据时代流数据处理问题的主要手段之一。相当多的复杂事件处理语言都采用正规式来描述由若干连续事件组成的复杂事件,利用连续、析取和克林闭包等算子来约定事件之间的关系,通过正规式模式匹配来检测复杂事件的出现。然而,网络中各种半结构化的流数据组织也是事件复杂性的来源,这种流数据结构的复杂性也会导致事件的复杂性。针对大数据时代日益增长的半结构化流数据处理需求,本文提出一种叫做正规树模式的事件模式及其模式匹配算法,用于检测来自于半结构化数据流的复杂事件。试图通过针对XML数据流的正规树模式匹配来识别复杂事件的发生,能够按照正规式方式来描述数据到达的时序以及XML节点的兄弟关系,也能够描述双亲子女、祖先后代等XML结构约束关系。这种基于正规树模式匹配的流数据查询技术集成了面向半结构化数据的树模式匹配和面向连续事件的正规式匹配技术,具有较强的复杂事件描述能力和检测能力。能够满足复杂事件检测对于复杂模式的检测需求和处理的高效性。通过对比试验表明这种模式匹配具有良好的性能和较强的事件描述能力,能够适应大数据处理中数据量大、数据价值低等特点。
【关键词】:复杂事件处理 事件模式 查询模式 XML
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-5
- Abstract5-8
- 第1章 绪论8-14
- 1.1 研究背景8
- 1.2 研究意义8-9
- 1.3 国内外文献综述9-11
- 1.3.1 XML数据树模式查询技术的研究现状9-10
- 1.3.2 流式XML数据树模式查询技术的研究现状10-11
- 1.3.3 复杂事件检测模型介绍11
- 1.4 课题来源11-12
- 1.5 本文的研究内容和主要贡献12
- 1.6 本文结构和内容组织12-14
- 第2章 背景知识和概念14-20
- 2.1 XML语言14
- 2.2 树模式的定义14-16
- 2.3 树模式的匹配16
- 2.4 TwigList算法16-19
- 2.4.1 算法简介16-17
- 2.4.2 算法中用到的数据结构17
- 2.4.3 算法描述17-18
- 2.4.4 TwigList存在问题的描述18-19
- 2.5 本章小结19-20
- 第3章 正规树模式20-24
- 3.1 正规树模式的定义20-21
- 3.2 正规树模式匹配21-22
- 3.3 查询节点的分类22-23
- 3.4 本章小结23-24
- 第4章 针对流数据的正规树模式匹配算法24-36
- 4.1 设计思想24
- 4.2 复杂事件检测的流程24-25
- 4.3 边缘分枝数据模型25
- 4.4 实例树数据模型25-26
- 4.5 边缘分枝过滤算法26-29
- 4.6 树模式匹配算法29-34
- 4.7 算法分析34-35
- 4.8 流数据匹配结果的获取35
- 4.9 本章小结35-36
- 第5章 复杂事件检测执行引擎的系统实现36-46
- 5.1 复杂事件检测执行引擎的模块图36
- 5.2 复杂事件检测执行引擎的工作流程36-37
- 5.3 类体系设计37-41
- 5.3.1 复杂事件处理引擎的类体系设计37-38
- 5.3.2 正规树模式节点的类体系设计38-39
- 5.3.3 实例树节点类体系设计39
- 5.3.4 自动机类体系设计39-41
- 5.4 实验环境41-42
- 5.5 测试结果及分析42-45
- 5.6 本章小结45-46
- 结论46-48
- 参考文献48-52
- 攻读学位期间发表的学术论文52-54
- 致谢54
本文编号:877326
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/877326.html