钓鱼网页联合特征与智能检测算法研究与实现
发布时间:2020-11-12 19:10
钓鱼网页欺诈是现代网络犯罪的主要手段。近几年,钓鱼网页攻击发生的次数显著上升,并在2017年创下历史新高。钓鱼网页攻击可以让诈骗方用最低的成本进行网页攻击部署,使其在短时间内进行大规模传播。为了保护互联网用户的信息安全免遭泄露,研究确定更加准确和有效的基于机器学习技术的自动网页检测方法来抵抗这种快节奏的网络攻击就显得至关重要。本文主要研究使用多来源的特征训练出能够有效检测钓鱼网页的分类模型。其中,分别从URL链接、网页内容元素和第三方网页相关信息这三个来源派生特征,对其进行特征提取、特征选择和特征重要度计算,得到基础特征。为了使分类模型表达出对网页更加丰富的细粒度的描述,引入联合特征率R(0R=1)对基础特征进行特征扩充和组合。在此基础上,使用多种常用的分类模型,系统地对比了利用不同维度特征训练出的分类模型在检测钓鱼网页方面的效果。首先,分别通过对各种分类模型的主要参数进行参数调整,训练出各自模型的最优参数模型,从各自最优参数模型中对比确定唯一的最优分类模型。其次,对比了基于不同联合特征率扩充所训练出的最优参数模型的分类效果。最后,将最优参数模型与已有相关研究成果进行对比,随机森林和神经网络模型检测效果优异,并且随着R的提升,分类模型对钓鱼网页的检测能力持续增强。本文还提出了一种改进的半监督学习自训练方法。该方法基于分治思想,将训练集中大规模未标记数据平均拆分为多个子数据集,依次在这些子数据集上对分类模型进行递归训练,得到最终分类模型。本文通过对比了多种分类模型在改进自训练方法中的分类效果和运行时间,与传统自训练方法相比,改进的自训练方法能够有效地检测钓鱼网页,并在保证分类效果与传统自训练方法持平的基础上,方法运行时间相比于传统自训练平均降低50%以上,实现了更优的方法时效性,为缺少大规模可靠标记数据和在线检测等场景提供了一种新的研究思路。
【学位单位】:西安工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP393.092
【部分图文】:
并在网页上呈现出请求用户私密信息的输入字段,如登录个人网上银行账户的详细信息。网页钓鱼的攻击过程如图1.1 所示,攻击者首先攻击网页服务器,通过注册新域名等方式建立钓鱼网页,利用黑客技术和社会工程学对用户进行诱骗,使用户在钓鱼网页上留下私密信息。图 1.1 攻击者通过钓鱼网页进行钓鱼攻击的流程图 1.2 展示了阿里巴巴公司的个人登录页面以及其相对应的伪造网页,图 1.2(a)为攻击者伪造的钓鱼网页,图 1.2(b)为合法的登录页面。从图中可以看出钓鱼网页在整体布局和形式上与真实网页都比较相似,除了专业人员能够根据 URL 判断出两个网页的异常外,普通用户难以从页面识别出哪个是钓鱼网页。因此攻击者可以轻而易举地获取用户在输入框中提交的邮箱和密码信息?
3(b)真实的阿里巴巴个人登录页面图 1.2 仿照阿里巴巴个人登录页面的钓鱼网页和真实页面络钓鱼的危害钓鱼攻击者通过建立伪装的合法网页骗取用户提供敏感信息。为了完常侵入网络托管和电子邮件帐户。他们破坏受害者的信用评级、欺骗千万美元的资金。据《中国互联网发展状况与安全报告》统计,仅在 网站数量已经远超 2014 年的 9.3 万个,同比增长 49.4%。据中国电子,截至目前我国因网络钓鱼受骗网民数量已达 6000 多万,年经济损失图 1.3 所示,在 APWG 发布的 2016 年全球网络钓鱼调查报告中,由这
西安工业大学硕士学位论文看出网络钓鱼攻击仍然是如今互联网的一个重大威胁。在全球范围内,存5 次独立的网络钓鱼攻击。同比 2015 年发现的 230,280 次攻击增加了超过攻击被定义为针对特定品牌或实体的钓鱼网页[4]。据最新统计显示,仅在 ,钓鱼攻击次数就高达 291096 次。在如今数字经济时代,网络钓鱼诈骗的个人用户乃至整个互联网都带来了非常大的危害。
【参考文献】
本文编号:2881122
【学位单位】:西安工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP393.092
【部分图文】:
并在网页上呈现出请求用户私密信息的输入字段,如登录个人网上银行账户的详细信息。网页钓鱼的攻击过程如图1.1 所示,攻击者首先攻击网页服务器,通过注册新域名等方式建立钓鱼网页,利用黑客技术和社会工程学对用户进行诱骗,使用户在钓鱼网页上留下私密信息。图 1.1 攻击者通过钓鱼网页进行钓鱼攻击的流程图 1.2 展示了阿里巴巴公司的个人登录页面以及其相对应的伪造网页,图 1.2(a)为攻击者伪造的钓鱼网页,图 1.2(b)为合法的登录页面。从图中可以看出钓鱼网页在整体布局和形式上与真实网页都比较相似,除了专业人员能够根据 URL 判断出两个网页的异常外,普通用户难以从页面识别出哪个是钓鱼网页。因此攻击者可以轻而易举地获取用户在输入框中提交的邮箱和密码信息?
3(b)真实的阿里巴巴个人登录页面图 1.2 仿照阿里巴巴个人登录页面的钓鱼网页和真实页面络钓鱼的危害钓鱼攻击者通过建立伪装的合法网页骗取用户提供敏感信息。为了完常侵入网络托管和电子邮件帐户。他们破坏受害者的信用评级、欺骗千万美元的资金。据《中国互联网发展状况与安全报告》统计,仅在 网站数量已经远超 2014 年的 9.3 万个,同比增长 49.4%。据中国电子,截至目前我国因网络钓鱼受骗网民数量已达 6000 多万,年经济损失图 1.3 所示,在 APWG 发布的 2016 年全球网络钓鱼调查报告中,由这
西安工业大学硕士学位论文看出网络钓鱼攻击仍然是如今互联网的一个重大威胁。在全球范围内,存5 次独立的网络钓鱼攻击。同比 2015 年发现的 230,280 次攻击增加了超过攻击被定义为针对特定品牌或实体的钓鱼网页[4]。据最新统计显示,仅在 ,钓鱼攻击次数就高达 291096 次。在如今数字经济时代,网络钓鱼诈骗的个人用户乃至整个互联网都带来了非常大的危害。
【参考文献】
相关期刊论文 前3条
1 黄华军;钱亮;王耀钧;;基于异常特征的钓鱼网站URL检测技术[J];信息网络安全;2012年01期
2 张卫丰;周毓明;许蕾;徐宝文;;基于匈牙利匹配算法的钓鱼网页检测方法[J];计算机学报;2010年10期
3 曹玖新;毛波;罗军舟;刘波;;基于嵌套EMD的钓鱼网页检测算法[J];计算机学报;2009年05期
本文编号:2881122
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2881122.html