基于用户关系行为的垃圾邮件判别机制的研究与实现
本文选题:垃圾邮件 切入点:用户关系行为 出处:《东北大学》2014年硕士论文
【摘要】:作为互联网最基础的应用之一,电子邮件的广泛使用使其占据互联网数据总量的三分之一左右。随着应用的增多,垃圾邮件数量的增长也非常迅速,网民每周收到的垃圾邮件占总邮件量的三分之二还多。近几年来,为应对垃圾邮件愈禁愈多的情况,众多研究人员提出了多种有效判别垃圾邮件的解决方案,但随着实际情况的变化,垃圾邮件发送形式和方法不断演进,各类技术总是无法长期发挥作用。本文总结了现有垃圾邮件判别技术,重点分析了邮件用户关系行为,在现有基于行为解析的垃圾邮件判别技术的基础上,归纳出邮件用户关系行为网络社区概念。根据邮件用户之间的关系,建立邮件用户关系行为网络,利用复杂网络社区划分算法划分用户关系社区,然后把这些用户关系社区应用于实际的垃圾邮件判别。本文在研究现有行为识别技术的过程中,把邮件通信行为网络看成是人际关系网络范畴,该判别机制的关键在于用户关系网络的社区划分。为此,引入快速Newman算法(简称FN算法)、CPM (Clique Percolation Method)算法和基于节点联系算法,建立对比社区划分机制,以获得最优划分。将建立的用户关系社区划分机制的具体模型应用到反垃圾邮件领域中,提高了垃圾邮件的识别精度和处理速度。为了提升判别机制的准确度,对通过用户关系行为社区识别出的可疑邮件采取进一步的判别,引入了分类回归树算法(CART),根据前期邮件头数据处理获得邮件行为特征数据,对照正常邮件行为进行多重判别。经过系统实现验证,结合测试数据的反馈结果证明,基于用户关系行为的垃圾邮件判别机制的设计是合理有效的,不仅减轻了邮件服务器的过滤负载,而且具有较高的准确率和很好的召回率。
[Abstract]:As one of the most basic applications of the Internet, email accounts for about 1/3 of the Internet data.With the increasing number of applications, the number of spam is also growing rapidly, and the amount of spam received by netizens accounts for more than 2/3 of the total number of emails each week.In recent years, in order to deal with the increasing number of spam, many researchers have put forward a variety of effective spam discrimination solutions, but with the change of the actual situation, the form and method of spam sending has been evolving.Technologies of all kinds can never work for a long time.This paper summarizes the existing spam discrimination technology, analyzes the email user relationship behavior, and summarizes the concept of email user relationship behavior network community on the basis of the existing spam discrimination technology based on behavior analysis.According to the relationship between email users, the behavior network of email user relationship is established, and the user relationship community is divided into user relationship communities by using complex network community partitioning algorithm, and then these user relationship communities are applied to the actual spam discrimination.In the course of studying the existing behavior recognition technology, this paper regards the mail communication behavior network as the category of interpersonal relationship network, and the key of this discriminant mechanism lies in the community division of the user relationship network.In order to obtain the optimal partition, the fast Newman algorithm and the node connection based algorithm are introduced in this paper.The specific model of user relationship community partitioning mechanism is applied to the anti-spam field, which improves the identification accuracy and processing speed of spam.In order to improve the accuracy of the discriminant mechanism, the classification and regression tree algorithm is introduced to obtain the characteristic data of mail behavior according to the pre-email header data processing.Compare the normal mail behavior with multiple discriminations.Through the verification of the system and the feedback result of the test data, it is proved that the design of the spam discriminant mechanism based on the user relationship behavior is reasonable and effective, and not only reduces the filtering load of the mail server, but also reduces the filtering load of the mail server.And has the high accuracy and the very good recall rate.
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.098
【相似文献】
相关期刊论文 前10条
1 杨葆红;防范垃圾邮件的几种措施[J];郑州铁路职业技术学院学报;2004年01期
2 Firefox;;在线狙击垃圾邮件[J];电脑迷;2005年16期
3 LX ,阮征 ,Joycat;垃圾邮件 你真的惹恼我了!(上)[J];电脑爱好者;2005年03期
4 许伟民;罗键;;厦门广电集团垃圾邮件的防范[J];中国传媒科技;2006年10期
5 冯秀彦;宋宏伟;杨凤勇;;防垃圾邮件方法探讨[J];石家庄职业技术学院学报;2006年06期
6 高良诚;;邮件过滤系统的设计与实现[J];铜陵职业技术学院学报;2007年01期
7 戴健;;飞马替你收邮件[J];电脑界.应用文萃;2000年08期
8 蔡健,黄国兴,谢孟军;基于数据挖掘方法的电子邮件过滤[J];微型电脑应用;2001年08期
9 呢仔男孩;垃圾邮件防守战[J];电脑爱好者;2001年09期
10 冯小民;彻底拒绝垃圾邮件[J];电脑爱好者;2001年16期
相关会议论文 前10条
1 张晶;姚建民;董守斌;张凌;;基于自然语言同现词汇的邮件过滤[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 蒯莉;;网络垃圾邮件的防范与治理[A];第十六次全国计算机安全学术交流会论文集[C];2001年
4 沈卫超;;邮件过滤器系统的设计与实现[A];中国工程物理研究院科技年报(2001)[C];2001年
5 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 张尼;姜誉;方滨兴;郭莉;;一个基于邮件路径地理属性分析的垃圾邮件过滤算法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
7 朱巧明;周志军;李培峰;;中文邮件语料库建设及其分类研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 仇小锋;陈鸣;贾永兴;;垃圾邮件及其防范技术[A];第九届全国青年通信学术会议论文集[C];2004年
9 张相於;陈继东;李玉坤;孟小峰;;TEXEM:一种基于实体的邮件任务提取策略[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 李婧;张焕国;;应用于贝叶斯过滤器的噪音消除算法研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
相关重要报纸文章 前10条
1 曹;拒绝垃圾邮件[N];中国电脑教育报;2003年
2 ;狙击垃圾邮件[N];中国电脑教育报;2004年
3 ;砍断垃圾邮件黑手[N];计算机世界;2003年
4 本报记者 张琳;防垃圾邮件怎样“行为识别”[N];网络世界;2005年
5 新华社记者 王缅 毛磊 杨骏 何德功 潘治;垃圾邮件全球泛滥,,法律怎么办[N];新华每日电讯;2003年
6 阮光尘邋朱元春;多层构建邮件免疫机能[N];中国计算机报;2007年
7 ;垃圾邮件不再是安全难题[N];网络世界;2006年
8 ;垃圾邮件传播追随“热点”[N];网络世界;2007年
9 刘向晨;垃圾邮件防治任重道远[N];中国电脑教育报;2003年
10 小新;邮箱也能自动过滤垃圾邮件[N];中国电脑教育报;2003年
相关博士学位论文 前6条
1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
2 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
3 王友卫;基于统计的垃圾邮件识别关键技术研究[D];吉林大学;2015年
4 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
5 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
6 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
相关硕士学位论文 前10条
1 朱凯健;基于向量空间模型的垃圾邮件过滤系统的设计与实现[D];内蒙古大学;2015年
2 卓小伍;基于改进度量尺度和阈值确定方法的马田系统及其在邮件过滤中的应用[D];南京理工大学;2015年
3 周文彬;基于链接挖掘的邮件网络中心性研究[D];北京化工大学;2015年
4 项学涛;基于赋权有向图的邮件网络亲缘关系研究与实现[D];国际关系学院;2015年
5 王旭;基于用户关系行为的垃圾邮件判别机制的研究与实现[D];东北大学;2014年
6 赵雪梅;校园网环境下行为模式识别垃圾邮件技术研究[D];安徽理工大学;2008年
7 王岩;基于内容的邮件过滤技术研究[D];北方工业大学;2010年
8 代伟;邮件过滤器的设计与实现[D];吉林大学;2010年
9 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
10 成宝国;基于统计方法的垃圾邮件处理技术研究[D];西北大学;2006年
本文编号:1707902
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1707902.html