当前位置:主页 > 管理论文 > 移动网络论文 >

HTTPS网页流量的指纹提取和识别技术研究

发布时间:2018-09-03 18:11
【摘要】:随着网络通讯技术的发展,为了有效能够保障用户个人隐私问题和数据传输安全,加密流量被广泛应用到了网络传输中。对于网页通讯,越来越多的Web站点也选择使用HTTPS协议来进行网页数据的传输。然而,许多不法分子利用了HTTPS协议的特性,在HTTPS网页中传播有害信息。为了能够有效地对HTTPS流量进行管理,需要采用一种方法对目标HTTPS网页建立指纹库,完成对未知HTTPS流量的指纹识别。本文在确立了两种可以作为HTTPS网页指纹信息的特征值后,首先实现了一套网页指纹信息采集系统,可以对目标网页进行实时的指纹库构建。系统通过主动访问目标HTTPS网页,同时采用旁路监听的方式进行网页流量捕获,从而采集网页的指纹信息。然后,研究了基于C4.5决策树算法的网页指纹识别方法对于HTTPS网页的识别效果,分别在只包含目标网页和包含背景流量的数据集上进行实验,并对实验结果进行了分析。在取得了上述实验结果基础上,本文又提出了一种基于网页对象特征的网页指纹识别算法,并实现了该算法的基础模型。鉴于实际网络环境中存在大量网页混合流量,本文分别研究了该算法对单个目标网页、多个目标网页以及加入背景流量后的网页指纹识别效果。最后,对上述两种指纹识别方法进行了对比和分析,阐述了其各自存在的优缺点以及方法本身适应的网路环境。结果表明,基于网页对象特征的网页指纹识别算法在识别含有多个目标网页的混合流上具有较高的可行度,且背景流的加入并不会影响到算法的正常运作。
[Abstract]:With the development of network communication technology, encryption traffic has been widely used in network transmission in order to effectively protect the personal privacy of users and the security of data transmission. For web communication, more and more Web sites also choose to use HTTPS protocol to transmit web data. However, many criminals take advantage of the HTTPS protocol to spread harmful information on HTTPS pages. In order to manage the HTTPS traffic effectively, a method is needed to establish the fingerprint database of the target HTTPS web page, and to complete the fingerprint identification of the unknown HTTPS traffic. After establishing two kinds of characteristic values which can be used as the fingerprint information of HTTPS pages, this paper first implements a set of fingerprint information collection system, which can construct the fingerprint database of the target web pages in real time. The system accesses the target HTTPS web page actively, and acquires the fingerprint information of the web page by the way of bypass monitoring. Then, the paper studies the effect of fingerprint recognition method based on C4.5 decision tree algorithm on HTTPS pages. Experiments are carried out on the data sets containing only target pages and background traffic, and the experimental results are analyzed. Based on the above experimental results, a fingerprint recognition algorithm based on web object features is proposed, and the basic model of the algorithm is implemented. In view of the large amount of web pages mixed traffic in the actual network environment, this paper studies the fingerprint recognition effect of the algorithm for single target web page, multiple target pages and web pages with background traffic respectively. Finally, the two fingerprint identification methods mentioned above are compared and analyzed. The advantages and disadvantages of the two methods and the suitable network environment are described. The results show that the fingerprint recognition algorithm based on web object features has a high feasibility in identifying mixed flows with multiple target pages, and the addition of background flow will not affect the normal operation of the algorithm.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.092

【相似文献】

相关期刊论文 前10条

1 万立夫;;让谷歌HTTPS搜索正常显示[J];电脑迷;2012年24期

2 屠晨阳;荆继武;王雷;向继;;HTTPS服务器密码算法测试工具设计与实现[J];信息网络安全;2011年09期

3 刘超;王轶骏;施勇;;匿名HTTPS隧道木马的研究[J];信息安全与通信保密;2011年12期

4 杨顺韬;;基于HTTPS隧道防火墙穿透技术研究与探讨[J];河池学院学报;2013年02期

5 徐楠,陈松乔,眭鸿飞;HTTPS通信流截获解析系统的设计与实现[J];中南大学学报(自然科学版);2005年04期

6 陆荣杰;刘知贵;郑晓红;;基于HTTPS隧道技术的统一认证平台研究与实现[J];计算机应用研究;2006年12期

7 魏兴国;;HTTP和HTTPS协议安全性分析[J];程序员;2007年07期

8 朱良锋;李健;刘立辉;庄俊玺;;JSSE访问带有未验证证书的HTTPS[J];计算机与信息技术;2006年03期

9 肖曦;南楠;;基于HTTPS的统一通信系统安全设计[J];物联网技术;2011年05期

10 Dream;;IE无法打开HTTPS的网站[J];电脑爱好者;2013年22期

相关会议论文 前10条

1 屠晨阳;荆继武;王雷;向继;;HTTPS服务器密码算法测试工具设计与实现[A];第26次全国计算机安全学术交流会论文集[C];2011年

2 吴建军;;谈网页设计的艺术性表现[A];经天纬地——全国测绘科技信息网中南分网第十九次学术交流会优秀论文选编[C];2005年

3 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

4 昝红英;苏玉梅;孙斌;俞士汶;;基于浅层分析的网页相关度研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

5 孙静;刘正捷;奚小玲;王慧;;帮助盲人理解网页信息的一种网页结构划分方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

6 曹淮;晁丁丁;;3D元素在网页信息传达中的应用研究[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年

7 唐超;刘辰;杨正球;;使用多层迭代分析和分类网页文档的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

8 马骁;王晓龙;王轩;卜永忠;;基于网页信息结构的网页体裁聚类分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

9 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年

10 于满泉;谭松波;许洪波;;网页内部结构挖掘技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

相关重要报纸文章 前10条

1 林莉;HTTPS的3种实现方法[N];计算机世界;2002年

2 边歆;XTM:更强大的UTM[N];网络世界;2008年

3 本报记者 曾居仁 通讯员 郝金荣;贵州“万村千乡”网页工程开辟为农服务新渠道[N];中国气象报;2012年

4 壮壮;批量保存网页信息[N];电脑报;2004年

5 罗震宇 严小斌;一种新型WEB开发技术的探讨[N];中国冶金报;2011年

6 钱鹏;网尽Web页中的好东东[N];电脑报;2004年

7 星之海洋;迈出网页制作的第一步[N];电脑报;2004年

8 河南 张金贵;FrontPage2000组件详解(四)[N];电脑报;2001年

9 枫尔;网站浏览提速的五大秘方[N];中国证券报;2004年

10 飘零剑客;网络监控利器——AnyView[N];中国电脑教育报;2004年

相关博士学位论文 前10条

1 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年

2 龚昌盛;基于语义标注的网页广告加载模型研究[D];武汉大学;2010年

3 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年

4 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年

5 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年

6 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年

7 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年

8 张勇实;基于链接相似性分析的WEB结构挖掘方法研究[D];哈尔滨工程大学;2012年

9 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年

10 余伟;基于用户个性挖掘的Web社区营销研究[D];武汉大学;2011年

相关硕士学位论文 前10条

1 康宁;HTTPS网页流量的指纹提取和识别技术研究[D];哈尔滨工业大学;2017年

2 牛林华;HTTPS应用分类技术研究[D];哈尔滨工业大学;2014年

3 王彬琦;基于特征提取的HTTPS页面分类检测系统的设计与实现[D];哈尔滨工业大学;2016年

4 丛小亮;HTTPS流量的获取与识别技术研究[D];哈尔滨工业大学;2016年

5 徐映;面向安卓平台的商品优惠推荐系统的设计与实现[D];天津大学;2015年

6 王定坤;基于中间人方式的HTTPS监控系统的设计与实现[D];上海交通大学;2008年

7 刘超;使用HTTPS隧道和WebService的木马通信及监控系统研究[D];上海交通大学;2012年

8 戴帅;基于ARM-Linux的嵌入式HTTPS服务器的研究与实现[D];武汉理工大学;2010年

9 张恒伽;基于中间人攻击的HTTPS协议安全性分析[D];上海交通大学;2009年

10 王立彦;HTTPS协议中间人攻击的实现与防御[D];东北大学;2011年



本文编号:2220770

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2220770.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e253f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com