基于数据挖掘分类算法的钓鱼网站检测研究
发布时间:2021-08-16 15:51
近年来,随着互联网的发展,网络逐渐成为人们工作、学习、购物以及金融交易等活动的平台,他给人们的工作和生活带来了很大的便利,在电子商务及电子金融产业日渐繁荣的同时,网络安全问题日益凸显,其中,钓鱼网站的危害尤其严重。钓鱼网站是一种基于社会工程学的攻击手段,是不法分子针对用户身份数据和金融账号进行欺骗的犯罪机制。钓鱼网站的网址、网页内容、布局等与真实网站极其相似,这使得没有安全意识的网民及其容易因此上当受骗,网络钓鱼在给人们带来巨大经济损失的同时也严重阻碍了电子商务的发展。有效遏制钓鱼网站是网络安全的保障,对网络钓鱼攻击的检测防御研究迫在眉睫。目前,国内外在防御钓鱼网站的研究上各有建树,然而都存在缺陷。近年来,在钓鱼网站检测方法的研究中,机器学习的应用取得巨大成效,将机器学习中各种分类算法应用于钓鱼网站检测识别可以有效得提高检测效率。因此,本文研究基于数据挖掘分类算法的钓鱼网站识别方法,本文研究重点在于分析比较机器学习中不同分类器算法在钓鱼网站检测上的分类性能。本文的主要工作分为三个部分,首先,本文采用PCA主成分分析法,对选取的钓鱼网站URL异常特征和多源融合特征的重要程度进行分析,获取...
【文章来源】:内蒙古财经大学内蒙古自治区
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景及研究意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.2.3 文献综述
1.3 论文主要研究内容及结构安排
1.3.1 论文主要研究内容
1.3.2 论文结构安排
第2章 相关理论研究
2.1 网络钓鱼
2.1.1 网络钓鱼攻击原理
2.1.2 钓鱼网站传播方式
2.1.3 常见几类钓鱼网站
2.1.4 攻击类别
2.2 数据挖掘与机器学习
2.2.1 数据挖掘
2.2.2 机器学习
2.3 分类问题概述
2.4 不平衡分类问题概述
2.4.1 不平衡数据分类的基本概念
2.4.2 不平衡数据分类评价指标
第3章 钓鱼网站特征提取与特征选择
3.1 钓鱼网站特征提取
3.2 钓鱼网站特征选择
3.2.1 PCA主成分分析法
3.2.2 特征选择与分析
第4章 分类器模型的比较
4.1 基于三种分类算法的钓鱼网站检测模型
4.1.1 SVM分类模型
4.1.2 随机森林算法模型
4.1.3 RBF神经网络算法模型
4.2 分类模型检测性能比较
4.2.1 实验样本集
4.2.2 实验环境
4.2.3 检测指标
4.2.5 实验结果
第5章 基于KELM算法的钓鱼网站检测优化模型
5.1 KELM—核极限学习机算法
5.1.1 极限学习机算法
5.1.2 核极限学习机
5.2 模型构建与检验
5.2.1 实验数据集
5.2.2 实验结果分析
第6章 结论与展望
6.1 论文工作总结
6.2 研究展望
参考文献
个人简介及攻读学位期间获得成果
致谢
【参考文献】:
期刊论文
[1]基于BP神经网络的双层启发式强化学习方法[J]. 刘智斌,曾晓勤,刘惠义,储荣. 计算机研究与发展. 2015(03)
[2]一种基于支持向量机的特征选择算法[J]. 代琨,于宏毅,李青. 模式识别与人工智能. 2014(05)
[3]基于PCA和多变量极限学习机的轴承剩余寿命预测[J]. 何群,李磊,江国乾,谢平. 中国机械工程. 2014(07)
[4]基于URL特征的钓鱼网站检测方式[J]. 蔺亚东. 电子测试. 2014(03)
[5]特征选择方法与算法的研究[J]. 李敏,卡米力·木依丁. 计算机技术与发展. 2013(12)
[6]基于贝叶斯和支持向量机的钓鱼网站检测方法[J]. 顾晓清,王洪元,倪彤光,丁辉. 计算机工程与应用. 2015(04)
[7]基于URL特征的Phishing检测方法(英文)[J]. 曹玖新,董丹,毛波,王田峰. Journal of Southeast University(English Edition). 2013(02)
[8]一种轻量级入侵检测技术[J]. 张立伟,戴磊,侯一凡. 计算机科学. 2012(S3)
[9]基于粗糙集及信息增益的数据挖掘预测算法[J]. 徐立萍,姜志旺. 中国科技论文. 2012(07)
[10]基于修正核函数SVM的网络入侵检测[J]. 井小沛,汪厚祥,聂凯. 系统工程与电子技术. 2012(05)
博士论文
[1]基于数据挖掘技术的模糊推理系统设计[D]. 白一鸣.大连海事大学 2013
[2]基于关联规则的基因芯片数据挖掘与应用[D]. 彭斌.第三军医大学 2008
硕士论文
[1]一种基于网页关联性特征的钓鱼检测方法[D]. 田先桃.南京邮电大学 2012
[2]基于空间数据库和视觉特征的钓鱼网页检测[D]. 曾兵.南京邮电大学 2012
[3]基于径向基函数神经网络入侵检测技术的研究[D]. 程曦.重庆大学 2005
本文编号:3345961
【文章来源】:内蒙古财经大学内蒙古自治区
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景及研究意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.2.3 文献综述
1.3 论文主要研究内容及结构安排
1.3.1 论文主要研究内容
1.3.2 论文结构安排
第2章 相关理论研究
2.1 网络钓鱼
2.1.1 网络钓鱼攻击原理
2.1.2 钓鱼网站传播方式
2.1.3 常见几类钓鱼网站
2.1.4 攻击类别
2.2 数据挖掘与机器学习
2.2.1 数据挖掘
2.2.2 机器学习
2.3 分类问题概述
2.4 不平衡分类问题概述
2.4.1 不平衡数据分类的基本概念
2.4.2 不平衡数据分类评价指标
第3章 钓鱼网站特征提取与特征选择
3.1 钓鱼网站特征提取
3.2 钓鱼网站特征选择
3.2.1 PCA主成分分析法
3.2.2 特征选择与分析
第4章 分类器模型的比较
4.1 基于三种分类算法的钓鱼网站检测模型
4.1.1 SVM分类模型
4.1.2 随机森林算法模型
4.1.3 RBF神经网络算法模型
4.2 分类模型检测性能比较
4.2.1 实验样本集
4.2.2 实验环境
4.2.3 检测指标
4.2.5 实验结果
第5章 基于KELM算法的钓鱼网站检测优化模型
5.1 KELM—核极限学习机算法
5.1.1 极限学习机算法
5.1.2 核极限学习机
5.2 模型构建与检验
5.2.1 实验数据集
5.2.2 实验结果分析
第6章 结论与展望
6.1 论文工作总结
6.2 研究展望
参考文献
个人简介及攻读学位期间获得成果
致谢
【参考文献】:
期刊论文
[1]基于BP神经网络的双层启发式强化学习方法[J]. 刘智斌,曾晓勤,刘惠义,储荣. 计算机研究与发展. 2015(03)
[2]一种基于支持向量机的特征选择算法[J]. 代琨,于宏毅,李青. 模式识别与人工智能. 2014(05)
[3]基于PCA和多变量极限学习机的轴承剩余寿命预测[J]. 何群,李磊,江国乾,谢平. 中国机械工程. 2014(07)
[4]基于URL特征的钓鱼网站检测方式[J]. 蔺亚东. 电子测试. 2014(03)
[5]特征选择方法与算法的研究[J]. 李敏,卡米力·木依丁. 计算机技术与发展. 2013(12)
[6]基于贝叶斯和支持向量机的钓鱼网站检测方法[J]. 顾晓清,王洪元,倪彤光,丁辉. 计算机工程与应用. 2015(04)
[7]基于URL特征的Phishing检测方法(英文)[J]. 曹玖新,董丹,毛波,王田峰. Journal of Southeast University(English Edition). 2013(02)
[8]一种轻量级入侵检测技术[J]. 张立伟,戴磊,侯一凡. 计算机科学. 2012(S3)
[9]基于粗糙集及信息增益的数据挖掘预测算法[J]. 徐立萍,姜志旺. 中国科技论文. 2012(07)
[10]基于修正核函数SVM的网络入侵检测[J]. 井小沛,汪厚祥,聂凯. 系统工程与电子技术. 2012(05)
博士论文
[1]基于数据挖掘技术的模糊推理系统设计[D]. 白一鸣.大连海事大学 2013
[2]基于关联规则的基因芯片数据挖掘与应用[D]. 彭斌.第三军医大学 2008
硕士论文
[1]一种基于网页关联性特征的钓鱼检测方法[D]. 田先桃.南京邮电大学 2012
[2]基于空间数据库和视觉特征的钓鱼网页检测[D]. 曾兵.南京邮电大学 2012
[3]基于径向基函数神经网络入侵检测技术的研究[D]. 程曦.重庆大学 2005
本文编号:3345961
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3345961.html