HTTPS网页流量的指纹提取和识别技术研究
[Abstract]:With the development of network communication technology, encryption traffic has been widely used in network transmission in order to effectively protect the personal privacy of users and the security of data transmission. For web communication, more and more Web sites also choose to use HTTPS protocol to transmit web data. However, many criminals take advantage of the HTTPS protocol to spread harmful information on HTTPS pages. In order to manage the HTTPS traffic effectively, a method is needed to establish the fingerprint database of the target HTTPS web page, and to complete the fingerprint identification of the unknown HTTPS traffic. After establishing two kinds of characteristic values which can be used as the fingerprint information of HTTPS pages, this paper first implements a set of fingerprint information collection system, which can construct the fingerprint database of the target web pages in real time. The system accesses the target HTTPS web page actively, and acquires the fingerprint information of the web page by the way of bypass monitoring. Then, the paper studies the effect of fingerprint recognition method based on C4.5 decision tree algorithm on HTTPS pages. Experiments are carried out on the data sets containing only target pages and background traffic, and the experimental results are analyzed. Based on the above experimental results, a fingerprint recognition algorithm based on web object features is proposed, and the basic model of the algorithm is implemented. In view of the large amount of web pages mixed traffic in the actual network environment, this paper studies the fingerprint recognition effect of the algorithm for single target web page, multiple target pages and web pages with background traffic respectively. Finally, the two fingerprint identification methods mentioned above are compared and analyzed. The advantages and disadvantages of the two methods and the suitable network environment are described. The results show that the fingerprint recognition algorithm based on web object features has a high feasibility in identifying mixed flows with multiple target pages, and the addition of background flow will not affect the normal operation of the algorithm.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.092
【相似文献】
相关期刊论文 前10条
1 万立夫;;让谷歌HTTPS搜索正常显示[J];电脑迷;2012年24期
2 屠晨阳;荆继武;王雷;向继;;HTTPS服务器密码算法测试工具设计与实现[J];信息网络安全;2011年09期
3 刘超;王轶骏;施勇;;匿名HTTPS隧道木马的研究[J];信息安全与通信保密;2011年12期
4 杨顺韬;;基于HTTPS隧道防火墙穿透技术研究与探讨[J];河池学院学报;2013年02期
5 徐楠,陈松乔,眭鸿飞;HTTPS通信流截获解析系统的设计与实现[J];中南大学学报(自然科学版);2005年04期
6 陆荣杰;刘知贵;郑晓红;;基于HTTPS隧道技术的统一认证平台研究与实现[J];计算机应用研究;2006年12期
7 魏兴国;;HTTP和HTTPS协议安全性分析[J];程序员;2007年07期
8 朱良锋;李健;刘立辉;庄俊玺;;JSSE访问带有未验证证书的HTTPS[J];计算机与信息技术;2006年03期
9 肖曦;南楠;;基于HTTPS的统一通信系统安全设计[J];物联网技术;2011年05期
10 Dream;;IE无法打开HTTPS的网站[J];电脑爱好者;2013年22期
相关会议论文 前10条
1 屠晨阳;荆继武;王雷;向继;;HTTPS服务器密码算法测试工具设计与实现[A];第26次全国计算机安全学术交流会论文集[C];2011年
2 吴建军;;谈网页设计的艺术性表现[A];经天纬地——全国测绘科技信息网中南分网第十九次学术交流会优秀论文选编[C];2005年
3 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
4 昝红英;苏玉梅;孙斌;俞士汶;;基于浅层分析的网页相关度研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 孙静;刘正捷;奚小玲;王慧;;帮助盲人理解网页信息的一种网页结构划分方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
6 曹淮;晁丁丁;;3D元素在网页信息传达中的应用研究[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年
7 唐超;刘辰;杨正球;;使用多层迭代分析和分类网页文档的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
8 马骁;王晓龙;王轩;卜永忠;;基于网页信息结构的网页体裁聚类分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
10 于满泉;谭松波;许洪波;;网页内部结构挖掘技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
相关重要报纸文章 前10条
1 林莉;HTTPS的3种实现方法[N];计算机世界;2002年
2 边歆;XTM:更强大的UTM[N];网络世界;2008年
3 本报记者 曾居仁 通讯员 郝金荣;贵州“万村千乡”网页工程开辟为农服务新渠道[N];中国气象报;2012年
4 壮壮;批量保存网页信息[N];电脑报;2004年
5 罗震宇 严小斌;一种新型WEB开发技术的探讨[N];中国冶金报;2011年
6 钱鹏;网尽Web页中的好东东[N];电脑报;2004年
7 星之海洋;迈出网页制作的第一步[N];电脑报;2004年
8 河南 张金贵;FrontPage2000组件详解(四)[N];电脑报;2001年
9 枫尔;网站浏览提速的五大秘方[N];中国证券报;2004年
10 飘零剑客;网络监控利器——AnyView[N];中国电脑教育报;2004年
相关博士学位论文 前10条
1 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年
2 龚昌盛;基于语义标注的网页广告加载模型研究[D];武汉大学;2010年
3 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
4 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年
5 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
6 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年
7 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年
8 张勇实;基于链接相似性分析的WEB结构挖掘方法研究[D];哈尔滨工程大学;2012年
9 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
10 余伟;基于用户个性挖掘的Web社区营销研究[D];武汉大学;2011年
相关硕士学位论文 前10条
1 康宁;HTTPS网页流量的指纹提取和识别技术研究[D];哈尔滨工业大学;2017年
2 牛林华;HTTPS应用分类技术研究[D];哈尔滨工业大学;2014年
3 王彬琦;基于特征提取的HTTPS页面分类检测系统的设计与实现[D];哈尔滨工业大学;2016年
4 丛小亮;HTTPS流量的获取与识别技术研究[D];哈尔滨工业大学;2016年
5 徐映;面向安卓平台的商品优惠推荐系统的设计与实现[D];天津大学;2015年
6 王定坤;基于中间人方式的HTTPS监控系统的设计与实现[D];上海交通大学;2008年
7 刘超;使用HTTPS隧道和WebService的木马通信及监控系统研究[D];上海交通大学;2012年
8 戴帅;基于ARM-Linux的嵌入式HTTPS服务器的研究与实现[D];武汉理工大学;2010年
9 张恒伽;基于中间人攻击的HTTPS协议安全性分析[D];上海交通大学;2009年
10 王立彦;HTTPS协议中间人攻击的实现与防御[D];东北大学;2011年
,本文编号:2220770
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2220770.html