当前位置:主页 > 管理论文 > 移动网络论文 >

基于最优特征选择和神经网络的钓鱼网站检测研究

发布时间:2020-05-15 18:06
【摘要】:随着互联网的发展、数据交换的频繁,信息交互之间的安全就变得尤为重要。钓鱼攻击手段由于其存活短、危害大的特点,已然成为增长速度最快的网络攻击方式。网络钓鱼攻击是一种利用社会工程学和技术欺骗来获取用户身份数据和金融账户数据的攻击手段。最常见的方式就是在网络上向用户发送伪造网站链接并诱惑用户点击,在用户没有授权的情况下监控和拦截用户的隐私信息,从而给用户带来巨大的经济损失。因此,建立一种快速检测和处理钓鱼网站的机制能够及时有效制止钓鱼攻击带来的危害。由于传统的钓鱼网站检测技术缺乏大规模数据集的主动学习能力,机器学习算法的自主提取特征已经成为主流检测技术。该检测方法的关键在于特征的构建和分类算法的选择。本文对检测钓鱼网站的相关特征进行深入研究。由于钓鱼网站的特征多种多样,人工提取的特征往往依赖于经验知识,这就或导致一些特征不能有效分辨出钓鱼网站,还会带来检测效率低下的问题。然而,这些无用的特征也会影响机器学习模型的训练效果,从而导致训练好的模型无法精确预测和检测钓鱼网站。机器学习算法模型在检测钓鱼网站也会表现出不同的效果,本文通过实验对比常用的机器学习模型的分类效果,选择更为高效的神经网络模型作为检测框架的算法模型。基于以上分析,本文在最优特征选择方法的基础上,提出了一种有效的神经网络检测模型OFS-NN(Optimal Feature Selection-Neural Network)来检测钓鱼网站。本文的主要工作如下:(1)在分析了当前存在的网络钓鱼技术的原理和现有的钓鱼网站检测模型优点和存在的缺陷的基础上,并通过对比各种机器学习检测模型,得出适合钓鱼网站的神经网络分类模型。神经网络模型具有高精度、较强的鲁棒性和对噪声数据有较强的容错能力。此外,神经网络模型能够模拟复杂的非线性关系和较好的学习能力,并可以预测出未知类型的钓鱼网站。(2)本文主要通过提取网站的URL信息、HTML信息和DNS等信息提取相应的敏感特征。但无用的特征会影响模型的检测效果和效率,针这一问题本文提出一个最优特征选择指标FVV(Feature Validity Value)剔除无用特征。在计算每个特征有效值的基础上,设置阈值以消除一些无用的特征来选择适合训练机器学习算法的最优特征集合。与Gain(信息增益)指标进行实验对比,所提出的指标有较好的特征选择能力。本文在FVV指标的基础上给出最优特征选择算法,提高了模型训练过程和检测过程的性能。(3)本文结合最优特征提取算法和神经网络算法,提出一个基于最优特征的神经网络钓鱼检测模型OFS-NN。本文通过选择最优特征集合,构建最优的神经网络分类器对钓鱼网站进行分类和预测。并且在对钓鱼网站检测时引入黑白名单机制提高检测效率。实验结果表明,所提出的OFS-NN模型为网络钓鱼网站的预测和检测提供了有效的解决方案。该模型具有较高的精度和强大的泛化能力,能够有效地识别出多种钓鱼网站类型。
【图文】:

网站


钓鱼网站的频繁出现,己经严重影响了金融服务彳/业的发展,使互联网用户逡逑遭受了巨大的损失。根据反钓鱼工作组(Anti-Phishing邋Working邋Group,,邋APWG)111逡逑的报告显示,网络钓鱼事件一直在持续增加。图1.3显示的是该组织在2017年逡逑II月至2018年12月期间确认的全球的网络钓&奉件数设。逡逑1^0000逦113897逡逑m邋100382逡逑100000逦88754邋I邋■邋81257逡逑)60232邋@邋57317邋65509邋60.926邋60887邋__邋画蜃逡逑2山丨川山IhTi逡逑^逦.S"邋cS'邋A"邋^邋A'邋^邋^邋^邋A"逡逑^邋^邋^/邋#邋#邋#逡逑f邋#邋."少邋a.邋#邋F邋n?令邋9邋C邋令个'邋P邋f逡逑v邋l逦l逡逑图1.1邋2017年7月至2018年9月期间的APWG钓鱼网站报告.逡逑Fig邋1.1邋APWG邋Phishing邋Report邋from邋July邋2017邋to邋September邋2018.逡逑此外,根据中国反钓鱼网站联盟(Anti-Phishing邋Alliance邋of邋China,APAC)I21的逡逑报告,钓鱼网站主要涉及三类行业.?电子商务、交易支付和金融证券。截至2018逡逑年12月份,该组织己经识别处理了邋435139个钓鱼网站。在2018年11邋J]份的钓逡逑鱼网站报告中

基本模型,网站,攻击者,网页


钓鱼攻击者往往会精心模仿合法网站,让伪造的网站与原网站产生很大的相逡逑似性,以此来误导用户访问。为了更好地防范钓鱼攻击,就需要进一步了解钓鱼逡逑攻击的原理和大致流程。具体的钓鱼攻击流程如图2.1所示:(1)攻击者通过申逡逑请域名DNS,模仿合法网页来构造和仿冒相似的网页,进而建造假冒网站和伪逡逑造钓鱼网站链接。(2)攻击者通过邮件、短信或社交网络向用户散布大量虚假链逡逑10逡逑
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.08;TP183

【相似文献】

相关期刊论文 前10条

1 ;严正声明[J];中国输血杂志;2019年07期

2 郭萍;;钓鱼网站的鉴别方法与防范策略研究[J];学术问题研究;2012年01期

3 郭萍;;钓鱼网站的鉴别方法与防范策略研究[J];湖北水利水电职业技术学院学报;2012年03期

4 陈炜宏;;基于决策树模型的构建方法及预测能力的分析——以钓鱼网站为例[J];通讯世界;2018年12期

5 ;严正声明[J];中国输血杂志;2018年01期

6 ;严正声明[J];中国输血杂志;2018年04期

7 杨云;徐光侠;雷娟;;基于属性降维的钓鱼网站检测方法[J];重庆邮电大学学报(自然科学版);2018年04期

8 李江丰;王玮;;钓鱼网站的识别与分析方法研究[J];通信管理与技术;2018年03期

9 技术宅;;你是这样上钩的? 解密新型钓鱼网站[J];电脑爱好者;2017年11期

10 朴正荣;;网络钓鱼网站的技术原理与抵御措施[J];物联网技术;2016年02期

相关会议论文 前4条

1 张丰;;反钓鱼监控体系建设探讨[A];第二届全国信息安全等级保护技术大会会议论文集[C];2013年

2 李晨;陈星霖;;一种多阶段控制方法在对抗钓鱼攻击中的应用[A];第26次全国计算机安全学术交流会论文集[C];2011年

3 方鸣;;互联网钓鱼网站处理系统组网[A];中国通信学会信息通信网络技术委员会2015年年会论文集[C];2015年

4 李增刚;;计算机病毒:寻租视角的分析[A];2011年(第九届)“中国法经济学论坛”论文集[C];2011年

相关重要报纸文章 前10条

1 秦伟;反钓联盟累计处理钓鱼网站72733个[N];科学时报;2011年

2 本报记者 来扬 实习生 郝帅;网购火车票:钓鱼网站骗钱新招术[N];中国青年报;2012年

3 石磊;一亿人次网民遭钓鱼网站侵袭“云攻击”正成为现实[N];科学时报;2011年

4 本报记者 王俊秀 实习生 翟璐;钓鱼网站出没,网购请注意[N];中国青年报;2011年

5 江舟 范通广;钓鱼网站,“钓”了上百万[N];检察日报;2019年

6 本报记者 黄鑫;钓鱼网站成网络诈骗主渠道[N];经济日报;2019年

7 鲁畅;北京重拳打击钓鱼网站[N];中国质量报;2019年

8 实习生 卢义杰 本报记者 陈璐;钓鱼网站与网购狂欢如影随形[N];中国青年报;2012年

9 记者 王晓洁 郭宇靖 卢国强;信息“黑市”为何如此猖獗?[N];经济参考报;2017年

10 北京商报记者 孙麒翔 石飞月;钓鱼网站遭国家急收网[N];北京商报;2017年

相关博士学位论文 前1条

1 张健毅;大规模反钓鱼识别引擎关键技术研究[D];北京邮电大学;2012年

相关硕士学位论文 前10条

1 刘博文;基于改进TCD图像检索和分类的钓鱼检测模型的研究[D];中国矿业大学;2019年

2 王雨琪;基于URL的钓鱼目标识别的研究[D];中国矿业大学;2019年

3 朱琪;基于页面特征的钓鱼网站层次化检测的研究[D];中国矿业大学;2019年

4 王文腾;基于线性SVM的钓鱼网站检测系统的设计与实现[D];北京建筑大学;2019年

5 叶成成;基于最优特征选择和神经网络的钓鱼网站检测研究[D];安徽大学;2019年

6 黄炎;基于智能算法的钓鱼网站识别研究[D];长春工业大学;2019年

7 潘良敏;基于GIST全局特征的钓鱼网站聚类算法研究[D];中南林业科技大学;2018年

8 赵佳琪;基于数据挖掘分类算法的钓鱼网站检测研究[D];内蒙古财经大学;2018年

9 邓娜;基于QR二维码钓鱼网站的识别系统研究[D];长安大学;2018年

10 韩浩;基于云计算的钓鱼网站检测研究[D];中国矿业大学;2018年



本文编号:2665430

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2665430.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2747b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com