基于发件人身份验证和分类集成的钓鱼邮件检测方法
发布时间:2020-07-04 12:35
【摘要】:近年来网络发展迅猛,已成为人们日常生活中不可或缺的存在。各种网络安全隐患随之而来,出现了一种以商业和政治为目的的网络犯罪类型高级持续性渗透攻击(APT),其常见的渗透突破方法包括网站挂马、电子邮件和即时消息。钓鱼邮件就是通过电子邮件进行渗透攻击,是非常常见的攻击手段。如今又出现了一种新形式的钓鱼邮件,即鱼叉式钓鱼邮件,通过伪装成目标的熟人进行有针对性的钓鱼。但是每个个体的性格、性别、写作习惯都不一样,即使是有意的模仿,也不能做到完全相似。因此本研究使用基于发件人身份验证的方法实现对鱼叉式钓鱼邮件的检测。在验证发件人身份过程中,需要从邮件中提取风格特征、性别特征和性格特征,然后使用分类器对邮件进行分类。但是普通钓鱼邮件不具备伪装发件人为目标熟悉的人这一特点,因此验证发件人身份并不适用于全部钓鱼邮件,对于其他情况的钓鱼邮件只能使用普通的检测方法进行检测。本文分别单独使用URL特征、关键词特征和邮件正文特征进行分类构造基分类器,然后将结果通过投票的方式进行集成,得到最终的检测结果。最后,在检测过程中提取的特征比较多,会造成过拟合现象的产生。因此在本文中,提出了一种基于密度和距离的降维方法。该方法通过计算特征之间的距离和局部密度,有效的将原始特征的维度降为简单而具有代表性的二维向量。以达到节省时间和提高准确率等性能的效果。最后实验结果表明本文研究的基于发件人身份验证和分类集成的钓鱼邮件检测方法是有效的。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.08;TP393.098
【图文】:
通过互联网应运而生的一系列事物,如电子商务、网络银行、在线教育、网络社交平台、手机支付等等已经深入到了生活中的各个方面。人们的日常联系不再局限于面对面交流,通过互联网更容易进行方便有效的沟通。电子邮件已经成为人们日常沟通中不可缺少的一种交流方式。在互联网时代的商业领域,电子邮件已经成为经常被提及的工具。根据 Radicati 最新的年度报告,电子邮件可能不会像即时消息应用程序或社交媒体那样快速增长,但电子邮件将继续存在[1]。图1-1 为 Radicati 年度报告 2017 年-2021 年全球邮件市场预测表格。从全球范围来看,到 2017 年为止,电子邮件用户预计达到 37 亿人,到 2021 年预计增长 3%,届时电子邮件用户将超过 41 亿。预计每日平均电子邮件流量将以更快的增长速度成倍增加。因为在此预测期间,企业和消费者模式的电子邮件每年都会增长4%,数量将从今年的每日平均 2690 亿增长到 2021 年的 3200 亿,电子邮件市场的收入也将呈现强势增长趋势,明年预计增长 22%,能够达到近 300 亿美元,并且一直持续到 2021 年都会保持两位数的增长幅度。届时,电子邮件的市场收入将达到近 470 亿美元。
图 1-2 钓鱼邮件检测总体模块图Figure1-2 Overall module map of phishing mail detection主要研究内容可以分为以下几方面内容:第一,通过基于写作风格、性别和性格的发件人身份验证方法检测鱼叉件。在这个过程中,对于目前使用的发件人身份验证的方法进行了深入研模块中,根据鱼叉式钓鱼邮件检测的相关文献,提出了能够获得较大检邮件特征。将发件人身份验证与鱼叉式钓鱼邮件的检测方式相结合,从种新的鱼叉式钓鱼邮件检测方法,提高检测效率。第二,基于分类集成的钓鱼邮件检测方法。通过研究,找出几种可以单邮件特征,然后利用集成学习的方法将几种邮件特征形成的基分类器通方式结合成为一个最终的分类器。利用上述两种方法的结合,可以将各件全面的检测出来。第三,基于密度和距离的降维处理方法。通过研究目前存在的降维方法此基础上提出一种基于新特征的特征提取方法的降维处理算法。以达到效率的目的。
本文编号:2741135
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.08;TP393.098
【图文】:
通过互联网应运而生的一系列事物,如电子商务、网络银行、在线教育、网络社交平台、手机支付等等已经深入到了生活中的各个方面。人们的日常联系不再局限于面对面交流,通过互联网更容易进行方便有效的沟通。电子邮件已经成为人们日常沟通中不可缺少的一种交流方式。在互联网时代的商业领域,电子邮件已经成为经常被提及的工具。根据 Radicati 最新的年度报告,电子邮件可能不会像即时消息应用程序或社交媒体那样快速增长,但电子邮件将继续存在[1]。图1-1 为 Radicati 年度报告 2017 年-2021 年全球邮件市场预测表格。从全球范围来看,到 2017 年为止,电子邮件用户预计达到 37 亿人,到 2021 年预计增长 3%,届时电子邮件用户将超过 41 亿。预计每日平均电子邮件流量将以更快的增长速度成倍增加。因为在此预测期间,企业和消费者模式的电子邮件每年都会增长4%,数量将从今年的每日平均 2690 亿增长到 2021 年的 3200 亿,电子邮件市场的收入也将呈现强势增长趋势,明年预计增长 22%,能够达到近 300 亿美元,并且一直持续到 2021 年都会保持两位数的增长幅度。届时,电子邮件的市场收入将达到近 470 亿美元。
图 1-2 钓鱼邮件检测总体模块图Figure1-2 Overall module map of phishing mail detection主要研究内容可以分为以下几方面内容:第一,通过基于写作风格、性别和性格的发件人身份验证方法检测鱼叉件。在这个过程中,对于目前使用的发件人身份验证的方法进行了深入研模块中,根据鱼叉式钓鱼邮件检测的相关文献,提出了能够获得较大检邮件特征。将发件人身份验证与鱼叉式钓鱼邮件的检测方式相结合,从种新的鱼叉式钓鱼邮件检测方法,提高检测效率。第二,基于分类集成的钓鱼邮件检测方法。通过研究,找出几种可以单邮件特征,然后利用集成学习的方法将几种邮件特征形成的基分类器通方式结合成为一个最终的分类器。利用上述两种方法的结合,可以将各件全面的检测出来。第三,基于密度和距离的降维处理方法。通过研究目前存在的降维方法此基础上提出一种基于新特征的特征提取方法的降维处理算法。以达到效率的目的。
【参考文献】
相关期刊论文 前4条
1 唐成华;刘鹏程;汤申生;谢逸;;基于特征选择的模糊聚类异常入侵行为检测[J];计算机研究与发展;2015年03期
2 蔺亚东;;基于URL特征的钓鱼网站检测方式[J];电子测试;2014年03期
3 彭富明;张卫丰;彭寅;;基于文本特征分析的钓鱼邮件检测[J];南京邮电大学学报(自然科学版);2012年05期
4 郑金彬;卓义宝;;基于密度的分布式聚类算法研究[J];计算机工程;2008年17期
本文编号:2741135
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2741135.html