基于图像语义理解的恶意网页识别方法研究
发布时间:2021-07-13 13:07
信息安全与用户财产以及个人利益息息相关,为防止用户误入恶意网页蒙受财产的损失,如何高速有效的鉴别网页的实际内容,成为时下研究的热点。然而随着当今信息产业的高速发展,信息传输速率得到了极大的提升,恶意网页从过去以文字作为主要的信息载体,逐渐过渡到图像与文字相结合的模式。特别在赌博、色情、诈骗等网页中,充斥着大量有害的图片信息。假使可以有效地提取这些图像特征,将有助于提高恶意网页的识别率。因此,本文通过提取网页图像的特征语义,结合网页文本特征以改善恶意网页的识别效果。论文开展的主要工作如下:(1)为有效的提取恶意网页中的图像信息,本文采用深度学习方法对图像进行识别,旨在提取图像信息辅助恶意网页检测。通过总结常用深度学习算法的优缺点设计对比实验,结合恶意网页的实际检测环境进行算法选型。同时针对MASK R-CNN中存在计算冗余现象,改善MASK R-CNN的网络结构,提升检测效率。(2)由于静态图像中可以表达的信息量较少,特别是姿态信息因表达不详尽易产生歧义性,因此本文采用语义分割和Kinect模板匹配法相结合的方法对目标姿态的语义进行预测,通过识别人体的基本姿态,再结合图像中的物体上下文信...
【文章来源】:南昌航空大学江西省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
018年1至6月全球恶意网址地域分布
图 1-2 2018 年 1 至 6 月诈骗网站类型比例出[2]:在现有的恶意网页类型分布中,如图 1-情网页,占 30.37%;其次为赌博和钓鱼欺诈类.78%。令人注意的是,相较于 2017 上半年,恶于 2018 年初虚拟货币的价格屡创新高,在暴利中注入恶意脚本,进行“挖矿”操作非法获利8 年新建立的恶意网站很少以单独类型出现,单、导航三合一的综合内容,危害更为严重。产业的发展,以及云计算安全系统性能的提升了改进。例如部分恶意网页可以检测到网页的定为普通用户时,则会将用户引导至恶意网页的脚本爬虫时,则会将脚本引入到正规网址,。此外还有部分恶意网页利用多段设置的方法站,当用户在钓鱼网站输入自身的账户信息后
并取得显著的成功。恶意网页的主要防御手段有:基于网页域名的网页识别基于文字内容的网页识别、基于视觉相似性的网页识别和基于机器学习的网识别四种。2.3.1 基于网页域名的网页识别由于网页无论是正规网页还是恶意网页,都有其唯一的统一资源定位(URL),因此网页的 URL 具有唯一性。且访问网址的唯一方式就是通过网页域名而不可被绕过,因此利用这一特征可以有效地记录恶意网页。通过对恶网页和可信网页的记录并建立数据库,只需调取待测网页的 URL,即可快捷确地对网页进行网页进行判断。基于网页域名的网页检测方法简单快速,且入成本低,同时因为记录网页为已知内容,所以不会产生误判。这些优点使此类方法被广泛应用于杀毒软件和浏览器插件(如图 2-2)。例如 360、瑞星小红伞的防火墙就增设了实时更新的云黑白名单库,在获得用户的许可后,即将访问的网页进行名单的对比,若待访问网址出现在黑名单库则向用户发相应的警告。
【参考文献】:
期刊论文
[1]基于权限与敏感API的恶意程序检测方法[J]. 盛超,魏盛娜. 电脑知识与技术. 2017(33)
[2]基于决策树的钓鱼网页的识别方法[J]. 魏盛娜,盛超. 电脑知识与技术. 2017(33)
[3]基于随机森林算法的用电负荷预测研究[J]. 李婉华,陈宏,郭昆,郭松荣,韩嘉民,陈羽中. 计算机工程与应用. 2016(23)
[4]基于改进编辑距离的字符串相似度求解算法[J]. 姜华,韩安琪,王美佳,王峥,吴雲玲. 计算机工程. 2014(01)
[5]基于SVM-RFE的钓鱼网页检测方法研究[J]. 王婷,彭勇,戴忠华,伊胜伟,韩兰胜. 华中科技大学学报(自然科学版). 2013(S2)
[6]基于视觉特征的网页正文提取方法研究[J]. 安增文,徐杰锋. 微型机与应用. 2010(03)
[7]基于嵌套EMD的钓鱼网页检测算法[J]. 曹玖新,毛波,罗军舟,刘波. 计算机学报. 2009(05)
[8]基于视觉的Web页面分块算法的改进与实现[J]. 高乐,张健,田贤忠. 计算机系统应用. 2009(04)
[9]基于分块的网页信息解析器的研究与设计[J]. 于满泉,陈铁睿,许洪波. 计算机应用. 2005(04)
[10]SVM-KNN分类器——一种提高SVM分类精度的新方法[J]. 李蓉,叶世伟,史忠植. 电子学报. 2002(05)
硕士论文
[1]钓鱼网页联合特征与智能检测算法研究与实现[D]. 贾雪鹏.西安工业大学 2018
[2]基于深度学习的垃圾网页智能检测方法研究[D]. 聂祥谦.华北电力大学(北京) 2018
[3]基于DBN的网络流量分类的研究[D]. 白雪.内蒙古大学 2015
[4]基于感知哈希算法的商标图像的检索[D]. 安坤.浙江理工大学 2014
本文编号:3282119
【文章来源】:南昌航空大学江西省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
018年1至6月全球恶意网址地域分布
图 1-2 2018 年 1 至 6 月诈骗网站类型比例出[2]:在现有的恶意网页类型分布中,如图 1-情网页,占 30.37%;其次为赌博和钓鱼欺诈类.78%。令人注意的是,相较于 2017 上半年,恶于 2018 年初虚拟货币的价格屡创新高,在暴利中注入恶意脚本,进行“挖矿”操作非法获利8 年新建立的恶意网站很少以单独类型出现,单、导航三合一的综合内容,危害更为严重。产业的发展,以及云计算安全系统性能的提升了改进。例如部分恶意网页可以检测到网页的定为普通用户时,则会将用户引导至恶意网页的脚本爬虫时,则会将脚本引入到正规网址,。此外还有部分恶意网页利用多段设置的方法站,当用户在钓鱼网站输入自身的账户信息后
并取得显著的成功。恶意网页的主要防御手段有:基于网页域名的网页识别基于文字内容的网页识别、基于视觉相似性的网页识别和基于机器学习的网识别四种。2.3.1 基于网页域名的网页识别由于网页无论是正规网页还是恶意网页,都有其唯一的统一资源定位(URL),因此网页的 URL 具有唯一性。且访问网址的唯一方式就是通过网页域名而不可被绕过,因此利用这一特征可以有效地记录恶意网页。通过对恶网页和可信网页的记录并建立数据库,只需调取待测网页的 URL,即可快捷确地对网页进行网页进行判断。基于网页域名的网页检测方法简单快速,且入成本低,同时因为记录网页为已知内容,所以不会产生误判。这些优点使此类方法被广泛应用于杀毒软件和浏览器插件(如图 2-2)。例如 360、瑞星小红伞的防火墙就增设了实时更新的云黑白名单库,在获得用户的许可后,即将访问的网页进行名单的对比,若待访问网址出现在黑名单库则向用户发相应的警告。
【参考文献】:
期刊论文
[1]基于权限与敏感API的恶意程序检测方法[J]. 盛超,魏盛娜. 电脑知识与技术. 2017(33)
[2]基于决策树的钓鱼网页的识别方法[J]. 魏盛娜,盛超. 电脑知识与技术. 2017(33)
[3]基于随机森林算法的用电负荷预测研究[J]. 李婉华,陈宏,郭昆,郭松荣,韩嘉民,陈羽中. 计算机工程与应用. 2016(23)
[4]基于改进编辑距离的字符串相似度求解算法[J]. 姜华,韩安琪,王美佳,王峥,吴雲玲. 计算机工程. 2014(01)
[5]基于SVM-RFE的钓鱼网页检测方法研究[J]. 王婷,彭勇,戴忠华,伊胜伟,韩兰胜. 华中科技大学学报(自然科学版). 2013(S2)
[6]基于视觉特征的网页正文提取方法研究[J]. 安增文,徐杰锋. 微型机与应用. 2010(03)
[7]基于嵌套EMD的钓鱼网页检测算法[J]. 曹玖新,毛波,罗军舟,刘波. 计算机学报. 2009(05)
[8]基于视觉的Web页面分块算法的改进与实现[J]. 高乐,张健,田贤忠. 计算机系统应用. 2009(04)
[9]基于分块的网页信息解析器的研究与设计[J]. 于满泉,陈铁睿,许洪波. 计算机应用. 2005(04)
[10]SVM-KNN分类器——一种提高SVM分类精度的新方法[J]. 李蓉,叶世伟,史忠植. 电子学报. 2002(05)
硕士论文
[1]钓鱼网页联合特征与智能检测算法研究与实现[D]. 贾雪鹏.西安工业大学 2018
[2]基于深度学习的垃圾网页智能检测方法研究[D]. 聂祥谦.华北电力大学(北京) 2018
[3]基于DBN的网络流量分类的研究[D]. 白雪.内蒙古大学 2015
[4]基于感知哈希算法的商标图像的检索[D]. 安坤.浙江理工大学 2014
本文编号:3282119
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3282119.html