基于决策粗糙集的个性化邮件过滤方法
发布时间:2021-10-16 10:07
随着网络技术的迅猛发展,电子邮件因为其经济、方便、快捷而得到了快速普及.同时,我们生活在一个多样化的时代,人们思想的独立性、多变性、差异性日益增强.因此,个性化是未来电子邮件技术发展的趋势.目前,针对个性化邮件过滤技术的研究较少.本文将决策粗糙集的风险偏好模型应用于个性化的垃圾邮件过滤中,由用户根据自身的风险偏好来确定损失值,邮件服务器根据损失值对邮件进行个性化分类.本文的主要工作如下:一、修改决策粗糙集的风险偏好模型在阈值参数取值范围上的错误,并进一步完善本模型的内容;二、针对分类条件概率的计算问题,提出一种新的基于向量空间模型的估计方法.考虑到了特征词的权重,使得模型更合理;三、从电子邮件用户的角度,提出一套损失值的取值标度,便于用户理解从而给出合意的损失值;四、提出基于决策粗糙集的个性化邮件过滤方法,服务器可根据三枝决策模型将邮件分成三类,也可根据二枝决策模型将邮件分成两类.实验结果表明,本文所提出的方法能体现用户的个性特征,并且根据三枝决策进行分类时,可减少邮件的误判率,提高分类精度.
【文章来源】:广西大学广西壮族自治区 211工程院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 垃圾邮件过滤技术研究现状
1.2.1 电子邮件的传输原理
1.2.2 电子邮件的结构
1.2.3 基于地址的过滤方法
1.2.4 基于内容的过滤方法
1.3 个性化过滤方法研究现状
1.4 基于粗糙集的垃圾邮件过滤技术研究现状
1.5 本文的主要工作及创新点
1.5.1 主要工作
1.5.2 创新点
1.6 本文的组织机构
第二章 粗糙集模型
2.1 信息系统和决策表
2.2 等价关系和等价类
2.3 上下近似
2.4 决策规则
2.5 粗糙隶属度
2.6 本章小结
第三章 决策粗糙集的风险偏好模型及其改进
3.1 决策粗糙集模型
3.2 决策粗糙集的风险偏好模型
3.3 改进的决策粗糙集风险偏好模型
3.5 估计P(X|[x]_R)的值
3.5.1 基于信息系统的估计方法
3.5.2 基于规则的估计方法
3.5.3 基于向量空间模型的估计方法
3.6 本章小结
第四章 基于决策粗糙集的个性化邮件过滤方法
4.1 损失值的标度
4.1.1 λ_(NP)的取值标度
4.1.2 λ_(NP)的取值标度
4.1.3 σ的取值标度
4.2 特征项的选取及规则的产生
4.2.1 Ch_r简介
4.2.2 规则的形式
4.3 过滤方法的流程和步骤
4.4 本章小结
第五章 实验结果与分析
5.1 特征词的选取
5.2 特征词置信度的计算
5.3 估计邮件的P(X|x)值
5.4 确定阈值参数
5.5 实验结果
5.5.1 模型质量的评价体系
5.5.2 实验结果分析
5.5.3 实验结果对比
5.6 本章小结
结论与展望
本文工作的总结
今后工作的展望
参考文献
致谢
攻读硕士学位期间发表论文及科研情况
【参考文献】:
期刊论文
[1]一种改进的贝叶斯算法在垃圾邮件过滤中的研究[J]. 马小龙. 计算机应用研究. 2012(03)
[2]一种改进KNN个性化邮件过滤的方法[J]. 邓文韬,王国胤,董振兴. 重庆邮电大学学报(自然科学版). 2011(06)
[3]集成学习和主动学习相结合的个性化垃圾邮件过滤[J]. 刘伍颖,王挺. 计算机工程与科学. 2011(09)
[4]基于粗糙集的加权朴素贝叶斯邮件过滤方法[J]. 邓维斌,王国胤,洪智勇. 计算机科学. 2011(02)
[5]一种基于决策粗糙集的自动聚类方法[J]. 于洪,储双双. 计算机科学. 2011(01)
[6]基于粗糙集的两阶段邮件过滤方法[J]. 邓维斌,洪智勇. 计算机应用. 2010(08)
[7]一种基于个性化邮件特征的反垃圾邮件系统[J]. 鲁晓南,接标. 计算机技术与发展. 2009(08)
[8]粗糙集与决策树在电子邮件分类与过滤中的应用[J]. 邓春燕,陶多秀,吕跃进. 计算机工程与应用. 2009(16)
[9]基于粗糙集和朴素贝叶斯的垃圾邮件过滤系统[J]. 陈炼,王芸,饶泓,邓少波. 南昌大学学报(工科版). 2009(01)
[10]基于粗糙集理论的双向垃圾邮件分类模型的研究[J]. 云炜,段禅伦. 计算机工程与科学. 2008(10)
硕士论文
[1]基于内容的电子邮件过滤系统的研究[D]. 王林平.电子科技大学 2010
本文编号:3439616
【文章来源】:广西大学广西壮族自治区 211工程院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 垃圾邮件过滤技术研究现状
1.2.1 电子邮件的传输原理
1.2.2 电子邮件的结构
1.2.3 基于地址的过滤方法
1.2.4 基于内容的过滤方法
1.3 个性化过滤方法研究现状
1.4 基于粗糙集的垃圾邮件过滤技术研究现状
1.5 本文的主要工作及创新点
1.5.1 主要工作
1.5.2 创新点
1.6 本文的组织机构
第二章 粗糙集模型
2.1 信息系统和决策表
2.2 等价关系和等价类
2.3 上下近似
2.4 决策规则
2.5 粗糙隶属度
2.6 本章小结
第三章 决策粗糙集的风险偏好模型及其改进
3.1 决策粗糙集模型
3.2 决策粗糙集的风险偏好模型
3.3 改进的决策粗糙集风险偏好模型
3.5 估计P(X|[x]_R)的值
3.5.1 基于信息系统的估计方法
3.5.2 基于规则的估计方法
3.5.3 基于向量空间模型的估计方法
3.6 本章小结
第四章 基于决策粗糙集的个性化邮件过滤方法
4.1 损失值的标度
4.1.1 λ_(NP)的取值标度
4.1.2 λ_(NP)的取值标度
4.1.3 σ的取值标度
4.2 特征项的选取及规则的产生
4.2.1 Ch_r简介
4.2.2 规则的形式
4.3 过滤方法的流程和步骤
4.4 本章小结
第五章 实验结果与分析
5.1 特征词的选取
5.2 特征词置信度的计算
5.3 估计邮件的P(X|x)值
5.4 确定阈值参数
5.5 实验结果
5.5.1 模型质量的评价体系
5.5.2 实验结果分析
5.5.3 实验结果对比
5.6 本章小结
结论与展望
本文工作的总结
今后工作的展望
参考文献
致谢
攻读硕士学位期间发表论文及科研情况
【参考文献】:
期刊论文
[1]一种改进的贝叶斯算法在垃圾邮件过滤中的研究[J]. 马小龙. 计算机应用研究. 2012(03)
[2]一种改进KNN个性化邮件过滤的方法[J]. 邓文韬,王国胤,董振兴. 重庆邮电大学学报(自然科学版). 2011(06)
[3]集成学习和主动学习相结合的个性化垃圾邮件过滤[J]. 刘伍颖,王挺. 计算机工程与科学. 2011(09)
[4]基于粗糙集的加权朴素贝叶斯邮件过滤方法[J]. 邓维斌,王国胤,洪智勇. 计算机科学. 2011(02)
[5]一种基于决策粗糙集的自动聚类方法[J]. 于洪,储双双. 计算机科学. 2011(01)
[6]基于粗糙集的两阶段邮件过滤方法[J]. 邓维斌,洪智勇. 计算机应用. 2010(08)
[7]一种基于个性化邮件特征的反垃圾邮件系统[J]. 鲁晓南,接标. 计算机技术与发展. 2009(08)
[8]粗糙集与决策树在电子邮件分类与过滤中的应用[J]. 邓春燕,陶多秀,吕跃进. 计算机工程与应用. 2009(16)
[9]基于粗糙集和朴素贝叶斯的垃圾邮件过滤系统[J]. 陈炼,王芸,饶泓,邓少波. 南昌大学学报(工科版). 2009(01)
[10]基于粗糙集理论的双向垃圾邮件分类模型的研究[J]. 云炜,段禅伦. 计算机工程与科学. 2008(10)
硕士论文
[1]基于内容的电子邮件过滤系统的研究[D]. 王林平.电子科技大学 2010
本文编号:3439616
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3439616.html