基于URL和网页特征的钓鱼检测技术
发布时间:2021-06-10 22:04
钓鱼网站,通过模仿一些合法网站,如银行等,欺诈互联网用户,非法获取其财产,并一直威胁着人们的网络空间安全。因此人们需要更有效的技术来防御钓鱼网站攻击。本文设计了基于URL的特征以及结合URL和网页特征的检测方法。网站URL特征可以大致分为三类;基础特征、字母频率特征、编辑距离,其中编辑距离特征提取策略为本文创新特征。实验证明,该特征可以有效提高模型准确率,最终分别在4000和40000条网址数据集上准确率为0.946和0.959。特别是使用Aho-Corasick算法进行URL特征自动提取,平均处理时间为14.1 ms/条。本文还提出了三类网页特征:网站内外链数目、前向链接和站内链接、是否包含登录窗口。通过对GBDT分类器模型进行参数调优,最终结合URL和网页特征,模型准确率为0.976,可以有效抵御网络钓鱼攻击。由于网页特征提取耗时较久,本文提出基于MongoDB+ES,对海量网站特征值进行预存储和查询。其同步特征值和查询平均时间为0.317 ms/条和17.914 ms/条,大大提升了检测效率。由于网页访问的不确定性,本文训练了基于URL特征的GBDT分类器A和基于全部特征的GBD...
【文章来源】:广东工业大学广东省
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
钓鱼网站仿冒对象情况
第一章 绪论来越多的研究人员开始探索解决此问题的方法。在过去两年中,公司 Riskified 和网络情报公司 IntSights 发布的联合报告指出[5],并收集客户信息的攻击网站数量正在增加。在对 2017年第三季度的数据对比后,两家公司发现网络钓鱼网站的数量增加了 297%出,这些网络钓鱼网站如今被设计的越来越细致,似乎与普通购
图 3-1 Aho-Corasick 算法字典树Figure 3-1 Aho-Corasick algorithm dictionary tree为字典树添加失败路径。具体而言,对于直接与根节点相连的节点匹配失败,则他们的 Fail 指针直接指向 root 即可,如图 3-1点的 Fail 指针设置如下:假设当前为父节点,记为 father,其子当前 child 节点的 Fail 指针时,首先需要查询其 father 节点的 点,假如是 root,则检查 root 的所有 child 中是否存在和当前 c母一样的节点,如果能够找到,则该节点即为 child 的 Fail 指针1 中 ,3 号节点为 7 号、9 号节点的 Fail 指针所指节点。如果没有ther → Fail → Fail 节点。不断重复上述过程,如果一直都找不到
【参考文献】:
期刊论文
[1]鱼叉式网络钓鱼攻击检测方法[J]. 池亚平,凌志婷,许萍,杨建喜. 计算机工程与设计. 2018(11)
[2]科技期刊钓鱼网站常用技术手段分析及防范措施[J]. 胡国强,杨彦荣,马秋明. 中国科技期刊研究. 2018(10)
[3]OAuth 2.0授权协议常见安全问题及修复建议[J]. 邱永哲. 无线互联科技. 2018(07)
[4]基于分类置信度和网站特征的钓鱼检测系统[J]. 陈旭,黎宇坤,袁华平,刘文印. 信息网络安全. 2017(09)
[5]一种基于内容分析的高性能反钓鱼识别引擎[J]. 王惟. 软件导刊. 2015(04)
[6]基于改进编辑距离的字符串相似度求解算法[J]. 姜华,韩安琪,王美佳,王峥,吴雲玲. 计算机工程. 2014(01)
硕士论文
[1]客户端钓鱼网站智能检测系统的设计与实现[D]. 程思宇.华北电力大学 2015
[2]基于登录页面及Logo图标检测的反钓鱼方案[D]. 杨明星.太原理工大学 2015
[3]基于AdaBoost算法的网络钓鱼检测系统的研究[D]. 李思强.江西理工大学 2015
本文编号:3223182
【文章来源】:广东工业大学广东省
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
钓鱼网站仿冒对象情况
第一章 绪论来越多的研究人员开始探索解决此问题的方法。在过去两年中,公司 Riskified 和网络情报公司 IntSights 发布的联合报告指出[5],并收集客户信息的攻击网站数量正在增加。在对 2017年第三季度的数据对比后,两家公司发现网络钓鱼网站的数量增加了 297%出,这些网络钓鱼网站如今被设计的越来越细致,似乎与普通购
图 3-1 Aho-Corasick 算法字典树Figure 3-1 Aho-Corasick algorithm dictionary tree为字典树添加失败路径。具体而言,对于直接与根节点相连的节点匹配失败,则他们的 Fail 指针直接指向 root 即可,如图 3-1点的 Fail 指针设置如下:假设当前为父节点,记为 father,其子当前 child 节点的 Fail 指针时,首先需要查询其 father 节点的 点,假如是 root,则检查 root 的所有 child 中是否存在和当前 c母一样的节点,如果能够找到,则该节点即为 child 的 Fail 指针1 中 ,3 号节点为 7 号、9 号节点的 Fail 指针所指节点。如果没有ther → Fail → Fail 节点。不断重复上述过程,如果一直都找不到
【参考文献】:
期刊论文
[1]鱼叉式网络钓鱼攻击检测方法[J]. 池亚平,凌志婷,许萍,杨建喜. 计算机工程与设计. 2018(11)
[2]科技期刊钓鱼网站常用技术手段分析及防范措施[J]. 胡国强,杨彦荣,马秋明. 中国科技期刊研究. 2018(10)
[3]OAuth 2.0授权协议常见安全问题及修复建议[J]. 邱永哲. 无线互联科技. 2018(07)
[4]基于分类置信度和网站特征的钓鱼检测系统[J]. 陈旭,黎宇坤,袁华平,刘文印. 信息网络安全. 2017(09)
[5]一种基于内容分析的高性能反钓鱼识别引擎[J]. 王惟. 软件导刊. 2015(04)
[6]基于改进编辑距离的字符串相似度求解算法[J]. 姜华,韩安琪,王美佳,王峥,吴雲玲. 计算机工程. 2014(01)
硕士论文
[1]客户端钓鱼网站智能检测系统的设计与实现[D]. 程思宇.华北电力大学 2015
[2]基于登录页面及Logo图标检测的反钓鱼方案[D]. 杨明星.太原理工大学 2015
[3]基于AdaBoost算法的网络钓鱼检测系统的研究[D]. 李思强.江西理工大学 2015
本文编号:3223182
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3223182.html