反钓鱼系统的研究与设计
发布时间:2023-09-13 21:08
一直以来,病毒和木马被看作是危害网络安全的主要因素,然而随着互联网广泛的使用,网络钓鱼作为一种新兴的攻击形式,正呈现逐年上升的趋势,凭借网络钓鱼方式进行欺骗的行为也越来越猖獗。这种“网络钓鱼”欺诈形式利用高仿真的网站,以假乱真,窃取网络用户的私人信息,甚至金融信息,进而获取相应的商业利益,严重威胁着网络在线交易和电子商务。 目前,主要的反钓鱼技术,有黑名单库检测和利用页面相似度检测。但是黑名单检测具有滞后性,页面相似度检测存在检出率低的缺陷。在深入分析钓鱼网站和综合现存的反钓鱼技术之后,设计了一种检出率高、误报率低的基于余弦定理页面相似度匹配的网络钓鱼检测系统,增加了域名黑名单模块和基于URL拼接的未知钓鱼检测模块,其中域名黑名单提高了系统检出率。提出了基于支持向量机(SVM)的特征模板分类的设计方案,提高了模板分类效率和准确率。本文的主要工作包括: 1、基于余弦定理的页面相似度匹配 将Html转换成对应的DOM树结构,进行分词和去除噪声处理,使用TF-IDF算法提取DOM树中分值高的词作为特征词,然后,用余弦定理计算该页面与特征模板的相似度,设定一个阈值,判定是否为钓鱼网站。 2、基...
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 课题的研究背景
1.2 国内外研究现状和意义
1.3 本文工作
1.4 本文组织结构
第二章 反钓鱼相关技术
2.1 知识库检测
2.2 URL特征检测
2.3 网页相似度检测
2.3.1 文本相似度检测
2.3.2 视觉相似度检测
2.4 本章小结
第三章 基于SVM特征模板分类的设计
3.1 特征模板的来源与结构
3.2 网页文本解析
3.3 预处理
3.4 提取特征词
3.5 SVM分类模型
3.6 本章小结
第四章 反钓鱼系统的设计
4.1 反钓鱼系统架构
4.2 模块设计
4.2.1 预处理模块
4.2.2 URL特征检测模块
4.2.3 相似度匹配模块
4.2.4 未知检测模块
4.2.5 验证反馈模块
4.3 本章小结
第五章 反钓鱼系统的实现和测试
5.1 系统实现
5.1.1 预处理模块的实现
5.1.2 URL特征检测模块的实现
5.1.3 相似度匹配模块的实现
5.1.4 未知检测模块的实现
5.1.5 验证反馈模块的实现
5.2 系统测试与分析
5.3 本章小结
结束语
参考文献
致谢
本文编号:3845908
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 课题的研究背景
1.2 国内外研究现状和意义
1.3 本文工作
1.4 本文组织结构
第二章 反钓鱼相关技术
2.1 知识库检测
2.2 URL特征检测
2.3 网页相似度检测
2.3.1 文本相似度检测
2.3.2 视觉相似度检测
2.4 本章小结
第三章 基于SVM特征模板分类的设计
3.1 特征模板的来源与结构
3.2 网页文本解析
3.3 预处理
3.4 提取特征词
3.5 SVM分类模型
3.6 本章小结
第四章 反钓鱼系统的设计
4.1 反钓鱼系统架构
4.2 模块设计
4.2.1 预处理模块
4.2.2 URL特征检测模块
4.2.3 相似度匹配模块
4.2.4 未知检测模块
4.2.5 验证反馈模块
4.3 本章小结
第五章 反钓鱼系统的实现和测试
5.1 系统实现
5.1.1 预处理模块的实现
5.1.2 URL特征检测模块的实现
5.1.3 相似度匹配模块的实现
5.1.4 未知检测模块的实现
5.1.5 验证反馈模块的实现
5.2 系统测试与分析
5.3 本章小结
结束语
参考文献
致谢
本文编号:3845908
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3845908.html