面向HTTP协议的特征匹配方法研究

发布时间：2020-08-22 20:42

【摘要】：随着互联网和移动互联网的高速发展,网络流量也逐渐向复杂化和海量化的方向发展。传统的匹配方法由于自身的问题在匹配的灵活性方面稍显不足,面对如今的网络流量已经逐渐变的无法适应,这主要体现在两点:1)网络流量中关键字之间通常会有一定的相对位置关系,这种相对位置关系往往体现着某种逻辑含义在里面,传统的串匹配算法无法满足这种需求;2)随着网络的发展,特定领域特定流量的安全规则数目呈现出一种爆发增长的趋势,而传统串匹配算法往往是通用的、普适性的,这也就意味着面对特定领域特定流量的串匹配时,无法做出针对性的优化来适应这种大规模的特定领域的串匹配问题。本文从以上两个角度出发,结合互联网中应用最广的HTTP协议,分别提出HTTP多域组合表达式匹配的问题和面向大规模URL模式串的匹配问题。具体包括以下几个方面:1)分析HTTP协议头部信息的特征以及针对HTTP头部信息匹配的需求,提出多域组合表达式匹配问题,并从匹配的灵活性角度将这种表达式分为“逻辑与”表达式和“偏序与”表达式。2)借鉴结合正则表达式自身的语义逻辑,将多域组合表达式转化为一种只包含“.*”的特殊的正则表达式的匹配问题。同时,借鉴正则表达式在网络安全领域的应用,为了取得正则式在匹配速度和内存消耗二者的折中分别采用混合自动机的整体架构设计,分组混合自动机和字母表缩减的优化措施。在此基础上给出了算法的整体匹配框架。3)针对特定的大规模URL匹配问题,在原有模式串匹配算法的基础上结合URL数据本身的特点,从降低哈希冲突概率和减少冲突时精确校验次数的角度出发,给出多种优化措施来适应千万规模URL模式串匹配的问题,提高了整体的匹配速度。
【学位授予单位】：北京邮电大学
【学位级别】：硕士
【学位授予年份】：2018
【分类号】：TP393.04
【图文】：

字段值,字段名,空格,格式

特定的ＨＴＴＰ信息进行的。ＨＴＴＰ信息是一种普通的文本信息格式，包含开始行逡逑（ｓｔａｒｔ－ｌｉｎｅ），信息头（ｍｅｓｓａｇｅ－ｈｅａｄｅｒ）和信息体（ｍｅｓｓａｇｅ－ｂｏｄｙ）三部分。无逡逑论是客户端的请求信息还是服务器端的响应信息都具有如下图２－１所示格式的一逡逑般结构。逡逑请求方法空格邋ＤＲＬ邋空格协议版本回车符换行符邋＼邋ｓｔａｒｔ邋ｌｉｎ＝逡逑头部字段名１逦：逦头部字段值１邋回车符换行符逡逑头醉段名２逦：逦头醉段值２邋回车符换行符逡逑逦邋邋邋邋邋Ｖ逦ｈｒａｄｅｒｓ逡逑￣头部字段名ｎ：逦头部字段值ｎ邋｜回车符｜换行符逡逑回车符｜换行符逡逑ｍｍ逦］逡逑＞邋ｂｏｄｙ逡逑逦邋Ｊ逡逑图２－１邋ＨＴＴＰ协议头部格式图逡逑７逡逑

状态行,示例,网站,服务器端

特点的信息到服务器端，请求头的种类有很多常用的请求头包括Ｈｏｓｔ，Ａｃｃｅｐｔ，逡逑Ｕｓｅｒ－Ａｇｅｎｔ，邋Ｃｏｎｎｅｃｔｉｏｎ，Ａｃｃｅｐｔ－Ｅｎｃｏｄｉｎｇ邋等。ＨＴＴＰ邋请求中邋ｂｏｄｙ邋—般为空，但逡逑也可以包含一些其它实体。下图２－２是访问某网站时的请求头示例：逡逑ｙ邋Ｒｓｑｉｉｅｓｔ邋Ｈｅａｄｅｒｓ逦ｓｃｘｘｃｅ逡逑Ａｃｃｅｐｔ：邋ｔｅｘｔ／ｈｔｎ；邋１，邋ａｐｐｌｉｃａｔｉｏｎ／ｘｈｔ？邋Ｉ－ｊ－ｘ－ｓｌ，ａｐｐｌｉｃａｔ邋ｉｏｎ／ｘｓ邋ｌ；邋ｑ＝８．９，邋ｉ？ａｇｅ／ｗｅｂｐ，邋ｉ＾ａｇｅ／ａｐｒ－ｇ，逦；邋ｑ＝８．邋Ｓ逡逑Ａｃｃｅｐｔ－Ｅｒ？ｃｄ＝ｎｇ：邋ｇｒｉｐ，邋ｄｅｆｌａｔｅ，邋ｆｃｒ逡逑Ａｃｃ６ｐｔ－Ｌａｎｇｕａａ＆：邋ｅｎ－ＵＳ，邋ｅｎ；邋ｑ＝ｅ．邋Ｓ，逦ｃ：＝０．６，邋２ｈ；邋ｑ＝＃rP醶rP蓿嗑rP颍瑁

本文编号：2801123

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/guanlilunwen/ydhl/2801123.html

上一篇：内容中心网络路由与转发的优化策略研究
下一篇：云网环境下业务平台自动部署参数的数据建模及实例化

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|