钓鱼网站辅助识别系统的设计与实现
发布时间:2022-02-22 05:21
网络钓鱼是互联网犯罪的最常见手段,随着互联网信息技术的不断发展人们对网络的依赖也越来越强,以盗取网络财产为目的的钓鱼现象也愈发普遍。钓鱼网站是钓鱼犯罪的形式之一,用户在误入钓鱼网站之后误以为进入了正规网站,向钓鱼中者暴露了自己的账户密码,导致被盗号,作为钓鱼攻击的最有力形式,钓鱼网站的网址可以使用邮件广告等方式四处传播,渗透力极强,因此建立具有较好识别能力的钓鱼网站检测系统,具有很高的实用性和安全价值。本文主要研究工作如下:1)针对待检测URL体量巨大,对于系统并发要求高等问题,设计分模块过滤URL机制,使用Redis去重和黑白名单库快速过滤掉大部分URL,并使用轻量级URL检测模块对URL进行再过滤,降低后续模块检测压力。2)使用机器学习算法对于已有数据集进行学习训练,本文使用级联检测的方法,将特征空间划分为URL文本特征、WHOIS特征与页面特征,使用轻量级的URL文本特征和WHOIS特征来训练URL分类器,使用页面特征训练页面分类器,在保证整体检测准确率的前提下,有效降低系统压力,保证了系统支持并发的能力。3)针对传统检测问题仅能分辨是否为钓鱼的二分类问题,本文添加了品牌识别模块...
【文章来源】:东南大学江苏省211工程院校985工程院校教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 基于黑名单的钓鱼网站检测
1.2.2 基于文本信息的检测
1.2.3 基于页面内容的检测
1.2.4 基于视觉相似性的检测
1.3 论文研究内容
1.4 论文组织结构
第二章 相关技术概述
2.1 钓鱼常见攻击手段
2.1.1 伪造URL
2.1.2 DNS钓鱼
2.1.3 XSS跨站脚本攻击
2.2 启发式钓鱼检测技术
2.2.1 支持向量机
2.2.2 决策树
2.2.3 集成学习
2.2.4 分类器评价指标
2.3 卷积神经网络
2.4 本章小结
第三章 系统需求分析与概要设计
3.1 系统需求分析
3.1.1 功能需求
3.1.2 非功能需求
3.2 系统功能模块划分
3.2.1 URL过滤模块
3.2.2 URL检测模块
3.2.3 页面检测模块
3.2.4 品牌识别模块
3.3 本章小结
第四章 系统详细设计与实现
4.1 URL过滤模块
4.1.1 基于Redis的去重机制
4.1.2 黑白名单设计
4.2 URL检测模块
4.2.1 特征选择
4.2.2 基于编辑距离的域名异常检测算法
4.2.3 模型训练
4.3 页面检测模块
4.3.1 特征选择
4.3.2 隐藏页面特征的处理
4.3.3 模型训练
4.4 品牌识别模块
4.4.1 识别流程
4.4.2 数据集构建
4.4.3 数据增强
4.4.4 迁移学习与网络模型
4.4.5 模型训练
4.5 本章小结
第五章 系统测试与结果分析
5.1 功能测试
5.1.1 URL过滤模块测试
5.1.2 URL检测模块测试
5.1.3 页面检测模块测试
5.1.4 品牌识别模块测试
5.2 非功能需求测试
5.3 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
本文编号:3638781
【文章来源】:东南大学江苏省211工程院校985工程院校教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 基于黑名单的钓鱼网站检测
1.2.2 基于文本信息的检测
1.2.3 基于页面内容的检测
1.2.4 基于视觉相似性的检测
1.3 论文研究内容
1.4 论文组织结构
第二章 相关技术概述
2.1 钓鱼常见攻击手段
2.1.1 伪造URL
2.1.2 DNS钓鱼
2.1.3 XSS跨站脚本攻击
2.2 启发式钓鱼检测技术
2.2.1 支持向量机
2.2.2 决策树
2.2.3 集成学习
2.2.4 分类器评价指标
2.3 卷积神经网络
2.4 本章小结
第三章 系统需求分析与概要设计
3.1 系统需求分析
3.1.1 功能需求
3.1.2 非功能需求
3.2 系统功能模块划分
3.2.1 URL过滤模块
3.2.2 URL检测模块
3.2.3 页面检测模块
3.2.4 品牌识别模块
3.3 本章小结
第四章 系统详细设计与实现
4.1 URL过滤模块
4.1.1 基于Redis的去重机制
4.1.2 黑白名单设计
4.2 URL检测模块
4.2.1 特征选择
4.2.2 基于编辑距离的域名异常检测算法
4.2.3 模型训练
4.3 页面检测模块
4.3.1 特征选择
4.3.2 隐藏页面特征的处理
4.3.3 模型训练
4.4 品牌识别模块
4.4.1 识别流程
4.4.2 数据集构建
4.4.3 数据增强
4.4.4 迁移学习与网络模型
4.4.5 模型训练
4.5 本章小结
第五章 系统测试与结果分析
5.1 功能测试
5.1.1 URL过滤模块测试
5.1.2 URL检测模块测试
5.1.3 页面检测模块测试
5.1.4 品牌识别模块测试
5.2 非功能需求测试
5.3 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
本文编号:3638781
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3638781.html