面向高速网络的细粒度网络应用协议识别技术研究
发布时间:2017-05-24 06:17
本文关键词:面向高速网络的细粒度网络应用协议识别技术研究,由笔耕文化传播整理发布。
【摘要】:面向应用层的细粒度网络协议识别技术当前被广泛应用于上网行为管理、网络流量分析与控制和下一代防火墙等多种网络安全应用场景中,而随着网络应用数量的增长,待识别协议特征集合的规模也急剧增加,因此如何在保证协议识别准确率的前提下,对高速网络中的大量应用层协议进行细粒度识别,是当前协议识别领域研究的一个主要方向。 本文针对在构造正则表达式协议规则库过程中随着协议特征数量的增多而产生的状态图爆炸问题,对当前主流的正则表达式协议识别算法的匹配原理以及产生爆炸问题的原因进行研究,并对对高速网络协议的应用层协议特征进行提取和分析总结,设计并实现了基于改进AC算法的协议识别算法,并对算法进行了验证。本文的主要研究内容及创新如下: (1)提取并分析总结了100个典型的应用层协议所具有的规律和特点。通过wireshark工具对100个各类型的网络应用行为进行抓包分析,对不同场景下抓取的数据包进行对比得出正则表达式形式的应用层协议特征,对协议特征进行归纳总结,并与普通正则表达式进行对比说明正则协议特征所独具的特点。 (2)提出并详细设计基于改进AC算法的的正则协议特征匹配算法。在对AC算法原理进行分析的基础上,提出了基于两次改进的AC算法进行正则协议识别的算法整体结构,并对改进的协议规则规构建算法和协议匹配算法进行详细设计。 (3)基于Java语言实现了改进算法并对算法的有效性和正确性进行了评测和验证。通过Java语言对算法进行实现并通过数学方法对算法整体的时间空间复杂度进行分析,最后通过对比使用改进算法和基于DZFA的协议识别算法对100个协议特征进行协议规则库构建的结果,验证了算法可以有效的解决大规模正则协议进行规则库构建时面临的爆炸问题。 本文通过结合应用的具体场景对正则表达式的匹配提出新的思路,使用改进的字符串匹配算法完成正则协议特征的匹配,有效解决了面对大规模协议特征时,协议规则库无法构建的难题,为同类问题的分析提供新的思路。
【关键词】:协议识别 DFA 正则表达式 AC算法
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.04
【目录】:
- 摘要4-6
- ABSTRACT6-11
- 第一章 绪论11-18
- 1.1 研究背景11-12
- 1.2 研究意义12
- 1.3 研究现状12-15
- 1.3.1 应用层协议识别研究12-14
- 1.3.2 正则表达式匹配方法研究14-15
- 1.4 研究内容15-16
- 1.5 论文组织结构16-18
- 第二章 高速网络协议识别相关算法研究18-29
- 2.1 DPI和DFI技术研究18-19
- 2.2 AC多模式匹配算法19-20
- 2.3 传统正则表达式匹配算法20-24
- 2.3.1 NFA正则表达式匹配算法21-22
- 2.3.2 DFA正则表达式匹配算法22-24
- 2.3.3 传统正则表达式算法对比24
- 2.4 改进的DFA算法24-27
- 2.4.1 DFA 压缩算法24-26
- 2.4.2 分组DFA算法26-27
- 2.5 各种协议识别算法比较27-28
- 2.6 本章小结28-29
- 第三章 典型的高速网络协议特征提取与综合分析29-49
- 3.1 典型的高速网络协议特征提取研究29-32
- 3.1.1 协议特征提取原则29-30
- 3.1.2 协议特征提取方法30-32
- 3.2 典型的高速网络协议特征提取32-46
- 3.2.1 HTTP及HTTPS类应用协议特征提取32-37
- 3.2.2 IM类应用协议特征提取37-42
- 3.2.3 股票期货类等软件协议特征提取42-46
- 3.3 典型的高速网络协议特征综合分析46-48
- 3.4 本章小结48-49
- 第四章 基于改进AC算法的协议识别算法设计49-59
- 4.1 AC算法匹配正则协议特征改进方案49-53
- 4.1.1 字符段中元字符处理49-51
- 4.1.2 正则表达式中“.*”的处理51
- 4.1.3 正则表达式中“.{m,n}”的处理51-52
- 4.1.4 AC算法匹配正则表达式集合52-53
- 4.2 正则表达式协议识别算法总体设计53-54
- 4.2.1 协议特征库构建53
- 4.2.2 协议规则库53
- 4.2.3 协议识别53-54
- 4.3 协议规则库构建算法设计54-57
- 4.3.1 协议规则库构建算法AC1设计54-56
- 4.3.2 协议规则库构建算法AC2设计56-57
- 4.4 协议特征识别算法设计57-58
- 4.4.1 AC匹配算法P1设计57
- 4.4.2 AC匹配算法P2设计57-58
- 4.5 本章小结58-59
- 第五章 基于改进AC算法的协议识别算法实现与评测59-68
- 5.1 正则表达式协议特征格式定义及解析59
- 5.2 改进协议识别算法核心算法实现59-62
- 5.2.1 改进的goto表构建算法实现60
- 5.2.2 改进的协议匹配算法实现60-62
- 5.3 协议识别算法的性能评测62-67
- 5.3.1 特征库构建算法分析62-63
- 5.3.2 协议匹配算法分析63-64
- 5.3.3 协议识别算法验证64-67
- 5.4 本章小结67-68
- 第六章 总结与展望68-70
- 6.1 工作总结68
- 6.2 下一步研究工作68-70
- 参考文献70-73
- 致谢73-74
- 攻读学位期间发表的学术论文74
【参考文献】
中国期刊全文数据库 前10条
1 柏明强;Fuzzy正则表达式与Fuzzy有限态自动机的关系[J];纯粹数学与应用数学;2000年04期
2 胡庆安;吴明慧;;基于双重特征的协议识别方法[J];计算机安全;2010年03期
3 谭用秋;严权峰;;一种压缩DFA的高效FPGA实现[J];电子技术;2014年09期
4 罗军;确定的有限自动机(DFA)化简方法改进[J];河南广播电视大学学报;2005年03期
5 陈曙晖;苏金树;范慧萍;侯婕;;一种基于深度报文检测的FSM状态表压缩技术[J];计算机研究与发展;2008年08期
6 邱丽萍,朱平;自动机和形式语言结构的理论研究[J];江南大学学报;2003年05期
7 王杰;石成辉;;基于正则表达式的动态应用层协议识别方案[J];计算机工程与应用;2010年18期
8 陈亮;龚俭;徐选;;应用层协议识别算法综述[J];计算机科学;2007年07期
9 丁晶;陈晓岚;吴萍;;基于正则表达式的深度包检测算法[J];计算机应用;2007年09期
10 邓凯元;姜磊;;正则表达式匹配引擎性能分析[J];计算机与现代化;2011年07期
本文关键词:面向高速网络的细粒度网络应用协议识别技术研究,由笔耕文化传播整理发布。
,本文编号:390006
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/390006.html