当前位置:主页 > 管理论文 > 移动网络论文 >

基于用户行为的邮件分类算法

发布时间:2018-06-19 18:47

  本文选题:分类算法 + 垃圾邮件 ; 参考:《计算机应用》2014年05期


【摘要】:针对垃圾邮件过滤过程中分类模型难以个性化、难以适应用户兴趣动态变化的问题,提出了一种基于用户行为的邮件分类算法。通过分析朴素贝叶(NB)斯分类算法的原理,改造朴素贝叶斯算法,使其具有动态调整能力。邮件服务器接收到新邮件后自动进行分类判别,用户浏览邮件的过程中对邮件进行操作,根据用户对错分邮件的处理自动将该邮件加入训练数据集,并动态更新相应特征的统计概率,使邮件分类算法能够依据用户对不同邮件的操作行为动态调整分类模型,以达到有效过滤垃圾邮件的目的。与常用的贝叶斯分类算法的实验比较表明在给定小样本集合进行训练的情况下,新算法对于垃圾邮件的识别率比传统的朴素贝叶斯方法、基于风险敏感的朴素贝叶斯方法等提高了10%,获得了较好的分类性能。
[Abstract]:In order to solve the problem that the classification model is difficult to personalize and adapt to the dynamic changes of users' interests in spam filtering, a classification algorithm based on user behavior is proposed. By analyzing the principle of NBs classification algorithm, the naive Bayes algorithm is modified to make it have the ability of dynamic adjustment. After receiving the new mail, the mail server automatically classifies and discriminates. During the process of browsing the mail, the mail is operated, and the mail is automatically added to the training data set according to the processing of the user's right and wrong mail. The statistical probability of the corresponding features is dynamically updated so that the mail classification algorithm can dynamically adjust the classification model according to the user's operation behavior to achieve the purpose of filtering spam effectively. The experimental results show that the new algorithm is more efficient than the traditional naive Bayesian algorithm in the case of training the set of small samples. The naive Bayes method based on risk sensitivity improves 10% and achieves better classification performance.
【作者单位】: 长沙学院信息与计算科学系;
【分类号】:TP393.098

【参考文献】

相关期刊论文 前9条

1 邓文韬;王国胤;董振兴;;一种改进KNN个性化邮件过滤的方法[J];重庆邮电大学学报(自然科学版);2011年06期

2 刘伍颖;王挺;;结构化集成学习垃圾邮件过滤[J];计算机研究与发展;2012年03期

3 马小龙;;一种改进的贝叶斯算法在垃圾邮件过滤中的研究[J];计算机应用研究;2012年03期

4 秦逸;;基于行为的垃圾邮件检测技术[J];计算机科学;2012年11期

5 薛正元;;基于改进贝叶斯决策的邮件过滤[J];计算机工程与应用;2013年07期

6 雷剑刚;孙细斌;;一种智能垃圾邮件过滤模型的仿真研究[J];计算机仿真;2013年05期

7 黄国伟;许昱玮;;基于用户反馈的混合型垃圾邮件过滤方法[J];计算机应用;2013年07期

8 李渊;廖闻剑;彭艳兵;程光;;复杂网络性质探讨及在垃圾邮件过滤中的运用[J];计算机科学;2013年S1期

9 Guanglu Sun;Hongyue Sun;Yingcai Ma;Yuewu Shen;;Spam Filtering:Online Naive Bayes Based on TONE[J];ZTE Communications;2013年02期

【共引文献】

相关期刊论文 前10条

1 申铉京;何月;张博;龙建武;;基于空间信息及隶属度约束的FCM图像分割算法[J];北京工业大学学报;2012年07期

2 苏艳刚;;一种改进自动更新的中文邮件过滤模型的设计[J];电脑知识与技术;2013年20期

3 翟军昌;车伟伟;;一种基于条件熵的垃圾邮件过滤算法[J];计算机与现代化;2014年02期

4 杨赫;孙广路;何勇军;;基于朴素贝叶斯模型的邮件过滤技术[J];哈尔滨理工大学学报;2014年01期

5 陈宇;;基于用户行为的个性化邮件分类算法[J];福建工程学院学报;2014年01期

6 周全强;张付志;;基于仿生模式识别的用户概貌攻击集成检测方法[J];计算机研究与发展;2014年04期

7 郭军权;诸葛建伟;孙东红;段海新;;Spampot:基于分布式蜜罐的垃圾邮件捕获系统[J];计算机研究与发展;2014年05期

8 翟军昌;秦玉平;车伟伟;;垃圾邮件过滤中信息增益的改进研究[J];计算机科学;2014年06期

9 陈念;唐振民;;QBC主动采样学习在垃圾邮件在线过滤中的应用[J];计算机工程与应用;2014年22期

10 杨艳燕;郭红转;路新华;;基于粗糙集的带决策规则边界的邮件过滤算法[J];计算机应用研究;2015年01期

【二级参考文献】

相关期刊论文 前10条

1 阎艳;黄智兴;邱玉辉;;一种基于派系过滤的社区进化发现研究[J];重庆师范大学学报(自然科学版);2009年02期

2 洪艳;程克勤;;基于电子邮件原理的垃圾邮件过滤策略[J];电脑知识与技术(学术交流);2007年09期

3 邓蔚;秦志光;刘峤;程红蓉;;抗好词攻击的中文垃圾邮件过滤模型[J];电子测量与仪器学报;2010年12期

4 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期

5 王美珍;李芝棠;吴汉涛;;改进的贝叶斯垃圾邮件过滤算法[J];华中科技大学学报(自然科学版);2009年08期

6 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期

7 姜远;周志华;;基于词频分类器集成的文本分类方法[J];计算机研究与发展;2006年10期

8 王涛;李舟军;颜跃进;陈火旺;;数据流挖掘分类技术综述[J];计算机研究与发展;2007年11期

9 刘赫;刘大有;裴志利;高滢;;一种基于特征重要度的文本分类特征加权方法[J];计算机研究与发展;2009年10期

10 朱明,王俊普,蔡庆生;一种最优特征集的选择算法[J];计算机研究与发展;1998年09期

【相似文献】

相关期刊论文 前10条

1 呢仔男孩;垃圾邮件防守战[J];电脑爱好者;2001年09期

2 冯小民;彻底拒绝垃圾邮件[J];电脑爱好者;2001年16期

3 林义湘;如何避免垃圾邮件的骚扰[J];电子与电脑;2002年10期

4 志杰;垃圾邮件大清除[J];计算机与农业;2002年03期

5 垂天翼;教您七个防护妙招使您远离垃圾邮件困扰[J];微计算机信息;2002年12期

6 徐涛;让垃圾邮件静静的走开[J];计算机与网络;2002年06期

7 苟宏,李龙海,周利华;高性能邮件转发服务器的设计与实现[J];计算机应用研究;2002年01期

8 金哲凡,石教英;基于统一消息的邮件通知系统的研究与实现[J];计算机工程与应用;2003年14期

9 赵江;走出垃圾邮件的泥潭[J];个人电脑;2003年11期

10 刘洋,杜孝平,黄星华,侯志辉,郭晨,周二胜,骆焕林;垃圾邮件的智能过滤系统设计探讨[J];微机发展;2003年04期

相关会议论文 前10条

1 张晶;姚建民;董守斌;张凌;;基于自然语言同现词汇的邮件过滤[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

2 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年

3 蒯莉;;网络垃圾邮件的防范与治理[A];第十六次全国计算机安全学术交流会论文集[C];2001年

4 沈卫超;;邮件过滤器系统的设计与实现[A];中国工程物理研究院科技年报(2001)[C];2001年

5 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

6 张尼;姜誉;方滨兴;郭莉;;一个基于邮件路径地理属性分析的垃圾邮件过滤算法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年

7 朱巧明;周志军;李培峰;;中文邮件语料库建设及其分类研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年

8 仇小锋;陈鸣;贾永兴;;垃圾邮件及其防范技术[A];第九届全国青年通信学术会议论文集[C];2004年

9 张相於;陈继东;李玉坤;孟小峰;;TEXEM:一种基于实体的邮件任务提取策略[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

10 李婧;张焕国;;应用于贝叶斯过滤器的噪音消除算法研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年

相关重要报纸文章 前10条

1 ;砍断垃圾邮件黑手[N];计算机世界;2003年

2 本报记者 张琳;防垃圾邮件怎样“行为识别”[N];网络世界;2005年

3 新华社记者 王缅 毛磊 杨骏 何德功 潘治;垃圾邮件全球泛滥,法律怎么办[N];新华每日电讯;2003年

4 阮光尘邋朱元春;多层构建邮件免疫机能[N];中国计算机报;2007年

5 ;垃圾邮件传播追随“热点”[N];网络世界;2007年

6 刘向晨;垃圾邮件防治任重道远[N];中国电脑教育报;2003年

7 小新;邮箱也能自动过滤垃圾邮件[N];中国电脑教育报;2003年

8 丝雨;“垃圾邮件”任凭围剿轻松反围剿[N];大众科技报;2002年

9 ;企业备战垃圾邮件[N];计算机世界;2004年

10 乐天;对付垃圾邮件德国出新招[N];计算机世界;2011年

相关博士学位论文 前6条

1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年

2 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年

3 王友卫;基于统计的垃圾邮件识别关键技术研究[D];吉林大学;2015年

4 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年

5 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年

6 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年

相关硕士学位论文 前10条

1 代伟;邮件过滤器的设计与实现[D];吉林大学;2010年

2 戴少锋;基于多层架构的邮件过滤系统研究[D];第一军医大学;2006年

3 肖e,

本文编号:2040897


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2040897.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9ba00***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com