当前位置:主页 > 管理论文 > 移动网络论文 >

恶意网页检测技术的研究与实现

发布时间:2020-06-05 07:56
【摘要】:随着信息化建设的快速发展,互联网已经成为人们日常生活不可或缺的一项,人们足不出户就可以享受到互联网带来的便利。然而互联网是一把双刃剑,方便和安全永远不能完美兼得,如此巨大数量的用户和网站由于安全问题而暴露出危险。互联网中存在各种各样的恶意网站、恶意软件、病毒木马,对用户个人隐私和财产安全造成巨大威胁,不仅给用户带来经济损失,甚至会危害社会和国家安全。这些网络攻击进化的越来越复杂和自动化,由于互联网传播迅速和各种类型的恶意网页层出不穷,为检测带来很大难度。论文分析了恶意网页的攻击与检测技术,针对URL检测中提取文本特征不足的问题提出了基于上下文信息的恶意URL检测方法,设计实现了基于该检测方法和网页源码静态检测方法相结合的恶意网页检测系统。主要工作和成果包括以下几个方面:(1)针对传统基于文本特征的检测方法没有考虑到URL中词的位置和上下文信息的不足,提出了一种基于上下文信息的恶意URL检测方法。该方法利用卷积神经网络模型自动提取文本特征,尤其是可以获取URL中词与词之间的上下文关系,减少了人工干预。(2)在基于上下文信息的恶意URL检测方法中,本文分析了URL分类和文本分类的不同之处,研究了URL混淆方式,对URL针对性的进行分词和预处理,暴露出恶意URL混淆意图,并且提出了利用字符之间视觉相似度改进后的编辑距离算法来计算域名相似性。使用开源工具Word2vec生成词向量,构建了适用于URL这种短文本分类的卷积神经网络,能够提取到现有检测方法无法捕获的文本特征。根据实验结果对比,该检测方法比传统利用词袋模型和支持向量机算法来分类URL在准确率和召回率均有所提升。然后利用基于机器学习算法的网页源码检测弥补了仅使用URL文本特征分类检测恶意网页类型不全面的缺点,结合两种检测技术的优点设计出一个检测方法,在低资源消耗的情况下保证检测率。(3)基于上述方法设计实现了恶意网页检测系统,描述了系统各主要模块的设计与实现方案,测试了整体系统的检测能力和检测效率。
【图文】:

超平面,支持向量,样本点,函数


兄=+1逦式⑷)逡逑\wTxj邋+b<-\,邋yt邋=邋-1逡逑如图2-2所示,距离超平面最近的几个样本点使得上述等式成立,它们被称逡逑为“支持向量”。从直观上而言,这个超平面应该是处于两类数据最中间的直线,逡逑也就是使直线两边的数据离直线间隔最大化。逡逑9逡逑

示意图,集成学习,示意图,学习器


2.3.3随机森林算法逡逑在机器学习中,,有一种方法是把多个弱分类器组合起来提升为强分类器,这逡逑种方法称为集成学习,是机器学习中的一大分支。集成学习器如图2-3所示。逡逑基学习器1邋\逡逑基学习器2逦逦邋逦逡逑结合邋逦&邋集成逡逑.逦?逦>算法逦学习器逡逑基学习器N邋Z逡逑图2-3集成学习示意图逡逑随机森林算法就是集成学习的一种,它的基本单元是决策树,其中的每棵树逡逑按照如下规则生成:逡逑(1)假设训练集大小为N,对于基分类器而言,也就是每个决策树的训练逡逑集大小均为N,但是抽样方法采用的是随机、有放回的抽取N个样本,这种抽逡逑样方式导致每个决策树的训练集都不相同并且有重复,增加每棵树的差异性,提逡逑升总体模型的能力。逡逑12逡逑
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.08

【相似文献】

相关期刊论文 前10条

1 杨光;;删除恶意网页对系统修改的几个方法[J];计算机与网络;2014年08期

2 韩丰海;查看恶意网页有妙招[J];电脑应用文萃;2005年09期

3 ;追击连环恶意网页病毒[J];计算机与网络;2004年09期

4 ;轻松对付恶意网页[J];中国会计电算化;2003年07期

5 ycx;对付恶意网页三法[J];中国电子与网络出版;2003年11期

6 徐海斌;;走出恶意网页的沼泽地[J];电脑应用文萃;2002年07期

7 倪一涛;陈咏佳;林柏钢;;基于自动解混淆的恶意网页检测方法[J];信息网络安全;2019年04期

8 冰河洗剑;;斩断恶意网页之手[J];电脑迷;2007年18期

9 CLX;;三招彻底防范恶意网页[J];电脑迷;2005年12期

10 李强 ,昊虫虫;清除恶意网页病毒又两招[J];电脑爱好者;2004年20期

相关会议论文 前3条

1 孙靖超;;一种基于机器学习的网页分类技术[A];第32次全国计算机安全学术交流会论文集[C];2017年

2 胡永涛;姚静晶;赵恒立;;国内政府网站安全状况主动调查[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年

3 唐雅茜;朱海波;黎玲;;破解恶意网页十大招[A];2008年广西气象学会学术年会论文集[C];2008年

相关重要报纸文章 前10条

1 cdrom;恶意网页几时休[N];中国电脑教育报;2002年

2 徐海斌;恶意网页我们这样对付它[N];中国电脑教育报;2002年

3 何斌;巧用“3721”屏蔽恶意网页[N];中国电脑教育报;2003年

4 ;对付恶意网页[N];中国电脑教育报;2003年

5 徐海斌;以牙还牙 巧治恶意网页病毒[N];中国电脑教育报;2002年

6 王书杰;追击连环恶意网页病毒[N];中国电脑教育报;2004年

7 边歆;恶意网页每天增加5000个[N];网络世界;2008年

8 ;“极限女孩”恶意网页病毒[N];中国财经报;2002年

9 天津 Kingstar;菜鸟VS恶意网页[N];电脑报;2003年

10 王绍清;和恶意网页代码拜拜[N];中国电脑教育报;2002年

相关博士学位论文 前2条

1 马洪亮;基于JavaScript的恶意网页异常检测方法研究[D];北京交通大学;2018年

2 沙泓州;面向大规模网络流量的URL实时分类关键技术研究[D];北京邮电大学;2015年

相关硕士学位论文 前10条

1 吴海滨;恶意网页检测技术的研究与实现[D];北京邮电大学;2019年

2 陈博深;代价敏感的多分类恶意网页识别系统研究与实现[D];北京邮电大学;2019年

3 陈常杰;基于图像语义理解的恶意网页识别方法研究[D];南昌航空大学;2019年

4 皇甫群泽;恶意网页检测系统的研究与实现[D];北京邮电大学;2018年

5 王维光;基于分类算法的恶意网页检测技术研究[D];北京邮电大学;2015年

6 罗剑;数据挖掘在恶意网页动态检测中的应用研究[D];上海交通大学;2012年

7 李敏;恶意网页检测系统的设计与实现[D];北京邮电大学;2016年

8 姚楠;基于客户端恶意网页收集与分析系统的安全技术研究[D];武汉理工大学;2014年

9 王松;基于学习的恶意网页智能检测系统[D];南京理工大学;2011年

10 张亮;面向Linux的浏览器恶意网页检测系统的设计与实现[D];哈尔滨工业大学;2016年



本文编号:2697744

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2697744.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6bf25***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com