当前位置:主页 > 管理论文 > 移动网络论文 >

面向HTTP协议的特征匹配方法研究

发布时间:2020-08-22 20:42
【摘要】:随着互联网和移动互联网的高速发展,网络流量也逐渐向复杂化和海量化的方向发展。传统的匹配方法由于自身的问题在匹配的灵活性方面稍显不足,面对如今的网络流量已经逐渐变的无法适应,这主要体现在两点:1)网络流量中关键字之间通常会有一定的相对位置关系,这种相对位置关系往往体现着某种逻辑含义在里面,传统的串匹配算法无法满足这种需求;2)随着网络的发展,特定领域特定流量的安全规则数目呈现出一种爆发增长的趋势,而传统串匹配算法往往是通用的、普适性的,这也就意味着面对特定领域特定流量的串匹配时,无法做出针对性的优化来适应这种大规模的特定领域的串匹配问题。本文从以上两个角度出发,结合互联网中应用最广的HTTP协议,分别提出HTTP多域组合表达式匹配的问题和面向大规模URL模式串的匹配问题。具体包括以下几个方面:1)分析HTTP协议头部信息的特征以及针对HTTP头部信息匹配的需求,提出多域组合表达式匹配问题,并从匹配的灵活性角度将这种表达式分为“逻辑与”表达式和“偏序与”表达式。2)借鉴结合正则表达式自身的语义逻辑,将多域组合表达式转化为一种只包含“.*”的特殊的正则表达式的匹配问题。同时,借鉴正则表达式在网络安全领域的应用,为了取得正则式在匹配速度和内存消耗二者的折中分别采用混合自动机的整体架构设计,分组混合自动机和字母表缩减的优化措施。在此基础上给出了算法的整体匹配框架。3)针对特定的大规模URL匹配问题,在原有模式串匹配算法的基础上结合URL数据本身的特点,从降低哈希冲突概率和减少冲突时精确校验次数的角度出发,给出多种优化措施来适应千万规模URL模式串匹配的问题,提高了整体的匹配速度。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.04
【图文】:

字段值,字段名,空格,格式


特定的HTTP信息进行的。HTTP信息是一种普通的文本信息格式,包含开始行逡逑(start-line),信息头(message-header)和信息体(message-body)三部分。无逡逑论是客户端的请求信息还是服务器端的响应信息都具有如下图2-1所示格式的一逡逑般结构。逡逑请求方法空格邋DRL邋空格协议版本回车符换行符邋\邋start邋lin=逡逑头部字段名1逦:逦头部字段值1邋回车符换行符逡逑头醉段名2逦:逦头醉段值2邋回车符换行符逡逑逦邋邋邋邋邋V逦hraders逡逑 ̄头部字段名n:逦头部字段值n邋|回车符|换行符逡逑回车符|换行符逡逑mm逦]逡逑>邋body逡逑逦邋J逡逑图2-1邋HTTP协议头部格式图逡逑7逡逑

状态行,示例,网站,服务器端


特点的信息到服务器端,请求头的种类有很多常用的请求头包括Host,Accept,逡逑User-Agent,邋Connection,Accept-Encoding邋等。HTTP邋请求中邋body邋—般为空,但逡逑也可以包含一些其它实体。下图2-2是访问某网站时的请求头示例:逡逑y邋Rsqiiest邋Headers逦scxxce逡逑Accept:邋text/htn;邋1,邋application/xht?邋I-j-x-sl,applicat邋ion/xs邋l;邋q=8.9,邋i?age/webp,邋i^age/apr-g,逦;邋q=8.邋S逡逑Accept-Er?cd=ng:邋grip,邋deflate,邋fcr逡逑Acc6pt-Languaa&:邋en-US,邋en;邋q=e.邋S,逦c:=0.6,邋2h;邋q=#rP醶rP蓿嗑rP颍瑁

本文编号:2801123

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2801123.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3ad15***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com