当前位置:主页 > 管理论文 > 移动网络论文 >

融合网页噪声和n-gram的钓鱼网站检测研究

发布时间:2017-05-06 21:13

  本文关键词:融合网页噪声和n-gram的钓鱼网站检测研究,由笔耕文化传播整理发布。


【摘要】:网络钓鱼(phishing)是一种基于社会工程学,通过虚假诈骗的手段获取用户机密信息以换取经济利益的在线恶意攻击。面对日新月异的海量网络钓鱼攻击,提出一种新型、高效、高精确的网络钓鱼防御方式迫在眉睫,对网络钓鱼攻击防御的研究具有较高的应用价值。本文对网络钓鱼国内外研究现状做了简略概述,对研究网络钓鱼攻击的目的和意义进行了简介。论述了网络钓鱼攻击的概念和基本攻击流程,总结了目前网络钓鱼攻击防御技术的主要特点。作者主要工作和取得的研究成果如下。(1)针对PayPal和eBay钓鱼网站库进行研究,对库中钓鱼网站样本预处理后进行网页噪声提取,随后结合n-gram技术形成网页特征并进行与原网站的相似度比较,利用所得相似度进行网络钓鱼攻击检测。综上,提出了融合网页噪声和n-gram的钓鱼网站检测算法。该算法选用网页中含量较少且稳定的网页噪声对网页进行特征描述,较其他算法,具有计算成本更低,计算速度更快,检测时效性更高的特点。(2)分析利用钓鱼网站检测算法对钓鱼网站库进行检测的结果,并分别为PayPal和eBay设定了钓鱼网站检测阈值。随后,进行钓鱼网站检测算法的检测结果的精确度和召回率的计算,发现本检测算法较高的精确度以及可靠性,其精确度PayPal和eBay分别达到了0.8863和0.8964,而召回率分别达到了0.8550和0.8229。通过作案人员利用同一钓鱼网站模板,固定针对某些受保护网站而进行的、具有团队化的恶意作案。(3)通过采集PhishTank认证并公布的PayPal的2490个钓鱼网站和eBay的1699个钓鱼网站,采用“网页噪声和n-gram融合的分析算法”对网页进行特征描述,得到钓鱼网站网页特征矩阵。对这些特征矩阵进行聚类分析后所得的结果表明:在PayPal钓鱼网站之间,有83.33%的网站具有相近的相似度,eBay钓鱼网站之间,有81.63%的网站数具有相近的相似度。由此断定,当前网络钓鱼是出自高度相似或相同的网页模板,针对同一个某受保护网站反复进行的恶意行为,其具有作案团队化。
【关键词】:网络钓鱼 钓鱼网站检测 网页噪声 n-gram
【学位授予单位】:中南林业科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.08
【目录】:
  • 摘要4-5
  • ABSTRACT5-9
  • 1 引言9-19
  • 1.1 研究目的与意义9-13
  • 1.2 国内外研究现状13-17
  • 1.2.1 国外研究现状13-15
  • 1.2.2 国内研究现状15-17
  • 1.3 研究内容17
  • 1.4 论文组织框架17-19
  • 2 网络钓鱼简介与分析19-23
  • 2.1 网络钓鱼攻击概念19-20
  • 2.2 网络钓鱼攻击流程20-21
  • 2.3 网络钓鱼防御分类21
  • 2.3.1 服务端器防御21
  • 2.3.2 用户端防御21
  • 2.3.3 第三方防御21
  • 2.4 本章小结21-23
  • 3 融合网页噪声和n-gram的钓鱼网站检测算法23-35
  • 3.1 网页噪声简介与分析23-26
  • 3.1.1 网页噪声概念23
  • 3.1.2 网页噪声分类23-24
  • 3.1.3 网页噪声提取方式24-26
  • 3.2 网络钓鱼攻击检测算法模型26-34
  • 3.2.1 网页噪声提取模型27-31
  • 3.2.2 n-gram语言模型31-33
  • 3.2.3 钓鱼网站相似度算法33-34
  • 3.3 检测精确度检测34
  • 3.4 本章小结34-35
  • 4 网络钓鱼攻击检测算法实验结果及分析35-52
  • 4.1 网络钓鱼攻击检测算法实验环境及数据采集35-36
  • 4.1.1 检测算法实验环境介绍35
  • 4.1.2 检测算法数据采集35-36
  • 4.2 网络钓鱼攻击检测算法实验结果36-38
  • 4.2.1 检测算法实验结果36-37
  • 4.2.2 检测算法精确度计算37-38
  • 4.3 网络钓鱼攻击检测算法结果分析38-41
  • 4.3.1 聚类分析概念38-39
  • 4.3.2 聚类分析分类39-40
  • 4.3.3 K-means聚类分析模型40-41
  • 4.4 钓鱼网站聚类实验结果与分析41-50
  • 4.4.1 钓鱼网站聚类结果41-50
  • 4.4.2 检测算法结果聚类分析结论50
  • 4.5 本章小结50-52
  • 5 总结与展望52-55
  • 5.1 总结52-53
  • 5.2 展望53
  • 5.3 网络钓鱼检测算法的改进建议53-55
  • 参考文献55-63
  • 硕士研究生期间发表的论文63-65
  • 硕士研究生期间参与的科研项目65-67
  • 致谢67

【参考文献】

中国期刊全文数据库 前1条

1 苏秀芝;;基于标题与文本距离的网页去噪算法的研究[J];中小企业管理与科技(下旬刊);2014年08期


  本文关键词:融合网页噪声和n-gram的钓鱼网站检测研究,由笔耕文化传播整理发布。



本文编号:349159

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/349159.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户da6e5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com