粒子群优化的SVM垃圾邮件过滤研究
发布时间:2022-01-13 14:23
随着互联网的普及,电子邮件作为一种方便、快捷、费用低廉的通讯方式得到了极大的普及。电子邮件在给人们工作生活带来巨大方便的同时,随之而来的垃圾邮件泛滥也使整个网络不堪重负,占用网络带宽,侵占收件人邮箱空间,耗费收件人的时间,数以万计的垃圾邮件袭击目标网站,造成被攻击网站网路堵塞,最终瘫痪的案例也时有发生。垃圾邮件泛滥降低了整个网络的运行效率,也对现实社会造成了严重危害。如何防范和过滤垃圾邮件引起了人们的极大关注,也是网络安全研究领域的热点问题之一本文针对垃圾邮件的过滤问题进行学习、研究和探讨,提出用粒子群优化的支持向量机(PSO-SVM)进行中文垃圾邮件过滤,并通过与其它如朴素贝叶斯(NB)、支持向量机(SVM)和遗传优化的支持向量机(GA-SVM)等算法进行理论上的横向比较,证明了PSO-SVM较其它常用的垃圾邮件过滤算法更适合进行中文垃圾邮件过滤,实验结果也证明了这一点。本文的内容大致可以分为四部分。首先介绍了垃圾邮件过滤研究的背景、意义、国内外研究现状以及本文的主要研究工作,并给出了各个章节的内容安排。其次,对电子邮件的基本知识进行简要的介绍,主要包括电子邮件的工作原理,电子邮件传...
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 研究意义
1.3 国内外研究现状及本文主要工作
1.3.1 国内外研究现状
1.3.2 本文主要工作
1.4 本文组织安排
2 电子邮件基本知识及其预处理
2.1 垃圾邮件的定义及其分类
2.2 电子邮件的工作原理
2.3 电子邮件相关协议
2.3.1 SMTP协议
2.3.2 POP3协议
2.3.3 IMAP协议
2.3.4 MIME协议
2.4 中文电子邮件的预处理
2.4.1 中文分词
2.4.2 去停用词
2.4.3 特征选择
2.4.3.1 信息增益
2.4.3.2 互信息
2.4.3.3 文档频率
2.4.3.4 χ~2统计量
2.4.4 特征值的计算
3 垃圾邮件过滤技术及文本分类算法
3.1 垃圾邮件过滤技术
3.1.1 基于IP层的过滤
3.1.2 基于SMTP协议的过滤
3.1.3 基于内容的过滤
3.2 垃圾邮件过滤与文本分类
3.3 常用的文本分类算法
3.3.1 朴素贝叶斯算法
3.3.2 K近邻算法
3.3.3 支持向量机算法
3.3.4 决策树算法
4 基于粒子群优化的支持向量机垃圾邮件过滤
4.1 支持向量机算法参数分析
4.2 遗传算法简介
4.3 遗传优化的支持向量机
4.4 粒子群算法
4.5 粒子群优化的支持向量机
4.6 PSO-SVM较GA-SVM优势分析
4.7 PSO-SVM垃圾邮件过滤
5 实验结果与分析
5.1 实验介绍
5.2 实验软硬件环境
5.3 实验垃圾邮件语料库
5.4 邮件预处理
5.5 实验的性能评估指标
5.6 实验结果
5.7 性能分析
6 结论与展望
6.1 本文工作总结
6.2 未来工作展望
参考文献
致谢
个人简历、在学期间发表的学术论文
【参考文献】:
期刊论文
[1]基于Log4j改进的日志存储应用研究[J]. 郭节. 软件导刊. 2011(01)
[2]基于REST Web服务的资源定位方法研究[J]. 钟约夫. 自动化与仪器仪表. 2010(05)
[3]Hibernate缓存机制研究与应用[J]. 敖小玲,黄晋. 计算机与现代化. 2010(09)
[4]面向资源的RESTful Web应用研究[J]. 潘冰. 微计算机应用. 2010(07)
[5]Grails框架研究[J]. 舒丹. 铜仁学院学报. 2010(02)
[6]浅谈Grails面向领域Web应用开发[J]. 张浩,王广兴. 微型电脑应用. 2009(08)
[7]基于Grails框架的Web应用开发[J]. 蔡波斯. 计算机应用与软件. 2009(08)
[8]基于REST架构风格的Web 2.0实现[J]. 戴亚娥,俞成海,尧飘海,李艳芳. 计算机系统应用. 2009(07)
[9]数据交换格式的研究和应用[J]. 兰素秋,孙淑霞,彭武杰. 电脑与电信. 2009(07)
[10]基于Spring框架的轻量级J2EE架构与应用[J]. 胡启敏,薛锦云,钟林辉. 计算机工程与应用. 2008(05)
博士论文
[1]Java虚拟机的自适应动态优化[D]. 邹琼.中国科学技术大学 2008
硕士论文
[1]基于REST架构风格的Web服务的研究和设计[D]. 杨波.江苏大学 2010
[2]基于Grails的Web应用研究[D]. 穆利伟.北京交通大学 2010
[3]基于MVC模式的Web开发框架Ruby on Rails的研究[D]. 孙奇.北京交通大学 2009
[4]轻量级J2EE架构的研究与应用[D]. 李金海.山东理工大学 2007
[5]基于J2EE和MVC模式的Web应用研究[D]. 刘继华.武汉理工大学 2003
本文编号:3586594
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 研究意义
1.3 国内外研究现状及本文主要工作
1.3.1 国内外研究现状
1.3.2 本文主要工作
1.4 本文组织安排
2 电子邮件基本知识及其预处理
2.1 垃圾邮件的定义及其分类
2.2 电子邮件的工作原理
2.3 电子邮件相关协议
2.3.1 SMTP协议
2.3.2 POP3协议
2.3.3 IMAP协议
2.3.4 MIME协议
2.4 中文电子邮件的预处理
2.4.1 中文分词
2.4.2 去停用词
2.4.3 特征选择
2.4.3.1 信息增益
2.4.3.2 互信息
2.4.3.3 文档频率
2.4.3.4 χ~2统计量
2.4.4 特征值的计算
3 垃圾邮件过滤技术及文本分类算法
3.1 垃圾邮件过滤技术
3.1.1 基于IP层的过滤
3.1.2 基于SMTP协议的过滤
3.1.3 基于内容的过滤
3.2 垃圾邮件过滤与文本分类
3.3 常用的文本分类算法
3.3.1 朴素贝叶斯算法
3.3.2 K近邻算法
3.3.3 支持向量机算法
3.3.4 决策树算法
4 基于粒子群优化的支持向量机垃圾邮件过滤
4.1 支持向量机算法参数分析
4.2 遗传算法简介
4.3 遗传优化的支持向量机
4.4 粒子群算法
4.5 粒子群优化的支持向量机
4.6 PSO-SVM较GA-SVM优势分析
4.7 PSO-SVM垃圾邮件过滤
5 实验结果与分析
5.1 实验介绍
5.2 实验软硬件环境
5.3 实验垃圾邮件语料库
5.4 邮件预处理
5.5 实验的性能评估指标
5.6 实验结果
5.7 性能分析
6 结论与展望
6.1 本文工作总结
6.2 未来工作展望
参考文献
致谢
个人简历、在学期间发表的学术论文
【参考文献】:
期刊论文
[1]基于Log4j改进的日志存储应用研究[J]. 郭节. 软件导刊. 2011(01)
[2]基于REST Web服务的资源定位方法研究[J]. 钟约夫. 自动化与仪器仪表. 2010(05)
[3]Hibernate缓存机制研究与应用[J]. 敖小玲,黄晋. 计算机与现代化. 2010(09)
[4]面向资源的RESTful Web应用研究[J]. 潘冰. 微计算机应用. 2010(07)
[5]Grails框架研究[J]. 舒丹. 铜仁学院学报. 2010(02)
[6]浅谈Grails面向领域Web应用开发[J]. 张浩,王广兴. 微型电脑应用. 2009(08)
[7]基于Grails框架的Web应用开发[J]. 蔡波斯. 计算机应用与软件. 2009(08)
[8]基于REST架构风格的Web 2.0实现[J]. 戴亚娥,俞成海,尧飘海,李艳芳. 计算机系统应用. 2009(07)
[9]数据交换格式的研究和应用[J]. 兰素秋,孙淑霞,彭武杰. 电脑与电信. 2009(07)
[10]基于Spring框架的轻量级J2EE架构与应用[J]. 胡启敏,薛锦云,钟林辉. 计算机工程与应用. 2008(05)
博士论文
[1]Java虚拟机的自适应动态优化[D]. 邹琼.中国科学技术大学 2008
硕士论文
[1]基于REST架构风格的Web服务的研究和设计[D]. 杨波.江苏大学 2010
[2]基于Grails的Web应用研究[D]. 穆利伟.北京交通大学 2010
[3]基于MVC模式的Web开发框架Ruby on Rails的研究[D]. 孙奇.北京交通大学 2009
[4]轻量级J2EE架构的研究与应用[D]. 李金海.山东理工大学 2007
[5]基于J2EE和MVC模式的Web应用研究[D]. 刘继华.武汉理工大学 2003
本文编号:3586594
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3586594.html