基于行为识别的垃圾邮件过滤技术的研究与应用
发布时间:2021-08-20 03:36
垃圾邮件泛滥问题日益严重,垃圾邮件过滤技术日益成为当今的研究热点。目前垃圾邮件过滤技术主要包括第一代基于规则的过滤技术、第二代基于内容的过滤技术和第三代基于行为的过滤技术。传统的第一代和第二代垃圾邮件过滤技术在处理效率,规则的持久性等方面存在一些不足。基于行为识别的垃圾邮件过滤技术在节省网络资源,处理效率上具有明显的优势。本文在现有的行为识别过滤技术研究基础之上,提出了一种基于行为特征加权的决策树过滤算法。基于行为特征加权的决策树过滤算法的思想为:针对大量的垃圾邮件所表现出来的行为特征,选取出一系列的行为特征,采用主成分分析法选取其中具有代表性的特征,然后选取等量的正常邮件和垃圾邮件,根据统计的方法分别计算某一特征对正常邮件和垃圾邮件的贡献率,作为其权值,采用决策树算法生成判别决策树,使用大量的已知属性的邮件样例测试决策树,分别得到正常邮件和垃圾邮件的加权平均权值,作为垃圾邮件和正常邮件的判断阈值。如果邮件的路径权值小于垃圾邮件阈值,则判定为垃圾邮件;如果大于正常邮件阈值,则该邮件被判断为正常邮件;介于二者之间则使用决策树算法判断。通过大量待测实例的仿真实验得到统计结果,实验结果表明基...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题的研究背景和意义
1.1.1 课题背景
1.1.2 电子邮件的安全缺陷
1.1.3 课题目的与意义
1.2 反垃圾邮件的研究历史及现状
1.2.1 垃圾邮件过滤技术的历史
1.2.2 行为识别技术的研究现状
1.3 本文的研究内容与组织结构
第2章 电子邮件过滤技术的研究
2.1 电子邮件头信息的分析
2.2 邮件头信息提取
2.3 垃圾邮件行为特征的分析
2.4 电子邮件特征的表示
2.5 本章小结
第3章 基于行为特征加权的决策树模型
3.1 主成分分析法
3.1.1 PCA计算方法
3.1.2 行为属性的选择
3.2 邮件行为特征权重计算
3.3 数据挖掘技术
3.3.1 决策树算法的选择
3.3.2 ID3和C4.5的比较
3.4 行为加权决策树模型
3.4.1 决策树的生成
3.4.2 节点路径权重
3.5 本章小结
第4章 实验过程与结果分析
4.1 实验环境
4.2 NPW阈值的确定
4.2.1 计算方法
4.2.2 计算过程
4.2.3 邮件的NPW
4.3 算法性能与分析
4.3.1 无权重决策树算法
4.3.2 特征加权的决策树算法
4.4 本章小结
第5章 总结与展望
5.1 研究工作总结
5.2 展望
致谢
参考文献
【参考文献】:
期刊论文
[1]ID3算法及其改进[J]. 徐雯,张扬. 计算机与数字工程. 2009(10)
[2]垃圾邮件过滤技术研究综述[J]. 陈志贤. 计算机应用研究. 2009(05)
[3]ID3算法的理论基础[J]. 翟俊海,张素芳,王熙照. 兰州大学学报(自然科学版). 2007(06)
[4]一种有效的C4.5改进模型[J]. 刘鹏,姚正,尹俊杰. 清华大学学报(自然科学版). 2006(S1)
[5]分布式垃圾邮件检测系统的研究与实现[J]. 吕新杰,柴乔林,马莉. 计算机工程. 2005(18)
博士论文
[1]基于内容的垃圾邮件过滤技术研究[D]. 孙晶涛.兰州理工大学 2010
硕士论文
[1]基于内容的垃圾邮件过滤系统的研究[D]. 周璐.吉林大学 2011
[2]基于行为识别的垃圾邮件过滤技术的研究[D]. 毛岩.大庆石油学院 2010
[3]基于行为分析的垃圾邮件过滤技术研究[D]. 朱文龙.哈尔滨工程大学 2010
[4]基于决策树算法的垃圾邮件通信行为检测过滤技术研究[D]. 王洪斌.哈尔滨理工大学 2008
[5]基于行为模式分类的反垃圾邮件技术研究[D]. 高岩.哈尔滨理工大学 2008
[6]行为识别技术在反垃圾邮件系统中的研究与应用[D]. 张耀龙.北京邮电大学 2006
[7]基于数据挖掘的中文垃圾邮件过滤技术研究[D]. 宁静.西南交通大学 2006
[8]基于Web服务的安全电子邮件用户代理[D]. 曾慧鹏.西南交通大学 2005
本文编号:3352730
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题的研究背景和意义
1.1.1 课题背景
1.1.2 电子邮件的安全缺陷
1.1.3 课题目的与意义
1.2 反垃圾邮件的研究历史及现状
1.2.1 垃圾邮件过滤技术的历史
1.2.2 行为识别技术的研究现状
1.3 本文的研究内容与组织结构
第2章 电子邮件过滤技术的研究
2.1 电子邮件头信息的分析
2.2 邮件头信息提取
2.3 垃圾邮件行为特征的分析
2.4 电子邮件特征的表示
2.5 本章小结
第3章 基于行为特征加权的决策树模型
3.1 主成分分析法
3.1.1 PCA计算方法
3.1.2 行为属性的选择
3.2 邮件行为特征权重计算
3.3 数据挖掘技术
3.3.1 决策树算法的选择
3.3.2 ID3和C4.5的比较
3.4 行为加权决策树模型
3.4.1 决策树的生成
3.4.2 节点路径权重
3.5 本章小结
第4章 实验过程与结果分析
4.1 实验环境
4.2 NPW阈值的确定
4.2.1 计算方法
4.2.2 计算过程
4.2.3 邮件的NPW
4.3 算法性能与分析
4.3.1 无权重决策树算法
4.3.2 特征加权的决策树算法
4.4 本章小结
第5章 总结与展望
5.1 研究工作总结
5.2 展望
致谢
参考文献
【参考文献】:
期刊论文
[1]ID3算法及其改进[J]. 徐雯,张扬. 计算机与数字工程. 2009(10)
[2]垃圾邮件过滤技术研究综述[J]. 陈志贤. 计算机应用研究. 2009(05)
[3]ID3算法的理论基础[J]. 翟俊海,张素芳,王熙照. 兰州大学学报(自然科学版). 2007(06)
[4]一种有效的C4.5改进模型[J]. 刘鹏,姚正,尹俊杰. 清华大学学报(自然科学版). 2006(S1)
[5]分布式垃圾邮件检测系统的研究与实现[J]. 吕新杰,柴乔林,马莉. 计算机工程. 2005(18)
博士论文
[1]基于内容的垃圾邮件过滤技术研究[D]. 孙晶涛.兰州理工大学 2010
硕士论文
[1]基于内容的垃圾邮件过滤系统的研究[D]. 周璐.吉林大学 2011
[2]基于行为识别的垃圾邮件过滤技术的研究[D]. 毛岩.大庆石油学院 2010
[3]基于行为分析的垃圾邮件过滤技术研究[D]. 朱文龙.哈尔滨工程大学 2010
[4]基于决策树算法的垃圾邮件通信行为检测过滤技术研究[D]. 王洪斌.哈尔滨理工大学 2008
[5]基于行为模式分类的反垃圾邮件技术研究[D]. 高岩.哈尔滨理工大学 2008
[6]行为识别技术在反垃圾邮件系统中的研究与应用[D]. 张耀龙.北京邮电大学 2006
[7]基于数据挖掘的中文垃圾邮件过滤技术研究[D]. 宁静.西南交通大学 2006
[8]基于Web服务的安全电子邮件用户代理[D]. 曾慧鹏.西南交通大学 2005
本文编号:3352730
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3352730.html