HTTPS应用分类技术研究
发布时间:2018-02-26 21:47
本文关键词: HTTPS 应用分类 指纹 机器学习 BOG 出处:《哈尔滨工业大学》2014年硕士论文 论文类型:学位论文
【摘要】:随着网络技术的快速发展,用户个人隐私问题越来越得到人们的重视,因此HTTPS加密技术得到了深入研究并被广泛应用到网页访问中。然而一些受限制的网站通过使用HTTPS让用户访问,以此来传播危害社会稳定的言论。传统的基于端口和载荷的流量识别方法无法识别HTTPS的加密流量,因而对网络管理提出了更高的要求。为了更好地管理网络流量,需要对HTTPS应用分类进行研究。本文通过对HTTPS协议的深入研究,提出了一种HTTPS协议特征和端口识别相结合的方法来识别网络中的HTTPS流量。同时利用SSL握手过程中server name扩展域信息和证书信息来标记HTTPS不用应用,通过对证书和扩展域进行统计分析,把扩展域和网络应用之间存在的对应关系作为先验知识应用到后续分类研究中。接着深入研究了三种HTTPS应用分类算法:HTTPS指纹识别算法、基于机器学习识别算法和基于改进的BOG识别算法。本文针对对指纹选择和特征选取方面做了改进:针对HTTPS指纹识别算法,通过实验对比选取了SSL分片长度序列作为HTTPS的指纹信息;而针对基于机器学习的识别算法,重点在机器学习算法选择和特征选取方面做了研究,最终选取C4.5算法作为机器学习的核心和SSL分片大小作为机器学习的特征。在离线环境下对三种分类算法进行对比实验,结果表明基于机器学习的识别算法在HTTPS应用分类中表现最好,分类的精度和召回率均达到95%以上。最后设计实现了HTTPS在线应用分类系统,选取了离线环境下表现最好的机器学习的识别算法作为分类系统的核心。实验结果表明在线应用识别准确率在91%以上。
[Abstract]:With the rapid development of network technology , the problem of personal privacy of users has been paid more and more attention , so HTTPS encryption technology has been deeply researched and widely applied to web page access .
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.0
【参考文献】
相关硕士学位论文 前2条
1 国石;SSL网络服务分类与识别技术研究[D];哈尔滨工业大学;2013年
2 扶佩佩;针对SSL协议的网络应用精细化分类技术研究[D];北京邮电大学;2013年
,本文编号:1539803
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1539803.html