基于Fuzzy Bayesian的学习和推理方法在邮件系统中的应用

发布时间:2018-07-04 21:16

  本文选题:垃圾邮件过滤 + 朴素贝叶斯 ; 参考:《中国地质大学(北京)》2017年硕士论文


【摘要】:近年来,随着网络技术的迅速发展,越来越多的人选择通过电子邮件(E-mail)这种简易而又快捷的通信方式来与他人联络。但这种便利的通信手段有时会潜在着不良因素——垃圾邮件,它可能不仅给人们的生活与工作带来困扰,也可能威胁着每个人的计算机系统或个人隐私的安全问题。因此寻找行之有效的垃圾邮件过滤方法已经成为研究者们感兴趣的一门研究课题。朴素贝叶斯分类算法是研究者们经常使用的一种用于过滤垃圾邮件的办法。它也是数据挖掘领域中简单易懂的一种分类算法,然而这种算法大多数情况下处理的是离散型数据。因此为了让朴素贝叶斯算法能够灵活地应对连续型数据,在分类的过程中往往需要对数据进行离散化处理。而模糊数学方面的相关理论恰恰可以用来解决这个问题。因此可以将二者结合来生成一个模糊贝叶斯混合模型,从而使整个分类模型去应对更多不同类型的数据,以此提高原有算法的分类性能。本课题研究了模糊贝叶斯混合模型在邮件系统中的应用,期间主要完成了以下工作:1.了解朴素贝叶斯算法、模糊数学以及三角模糊数的基本概念,收集相关理论知识和有关研究成果。找出朴素贝叶斯算法存在的缺陷,从而解决朴素贝叶斯为什么能够与模糊数学进行混合的问题。2.创建模糊贝叶斯混合分类模型的过程中,在去模糊化阶段引用了一种新的去模糊化方法“内心法”,该方法利用了三角形的内心来将三角模糊数转换成精确值。3.了解邮件系统的逻辑和功能结构,并通过查阅资料熟悉邮件传输的过程。4.收集邮件数据样本,并分别构造出用于分类的训练集和测试集。然后将混合分类模型应用于系统的邮件分类模块中,通过测试分析来总结混合模型性能。本文详细阐述了以上工作内容,同时总结、反思了研究中目前仍然存在的问题和需要改进的地方。
[Abstract]:In recent years, with the rapid development of network technology, more and more people choose to communicate with others through E-mail, a simple and fast way of communication. However, this convenient means of communication is sometimes potentially a bad factor-spam. It may not only bring troubles to people's life and work, but also threaten everyone's computer system or personal privacy security problems. Therefore, the search for effective spam filtering methods has become an interesting research topic. Naive Bayes classification algorithm is often used by researchers to filter spam. It is also a simple and easy to understand classification algorithm in the field of data mining, but in most cases, this algorithm deals with discrete data. Therefore, in order to make naive Bayesian algorithm flexible to deal with continuous data, it is often necessary to discretize the data in the process of classification. The theory of fuzzy mathematics can be used to solve this problem. So we can combine the two to generate a fuzzy Bayesian mixed model, so that the whole classification model can deal with more different types of data, so as to improve the classification performance of the original algorithm. In this paper, the application of fuzzy Bayesian hybrid model in mail system is studied, and the following work is accomplished: 1. The basic concepts of naive Bayes algorithm, fuzzy mathematics and triangular fuzzy numbers are understood, and relevant theoretical knowledge and related research results are collected. Find out the defects of naive Bayes algorithm, and solve the problem of why naive Bayes can be mixed with fuzzy mathematics. In the process of creating a fuzzy Bayesian mixed classification model, a new de-fuzzification method, "inner method", is introduced in the de-fuzzification stage. This method uses the heart of a triangle to convert the triangular fuzzy number into an exact value .3. Understand the logic and functional structure of the mail system, and familiarize yourself with the mail transfer process. Collect mail data samples and construct training set and test set for classification respectively. Then the hybrid classification model is applied to the mail classification module of the system, and the performance of the hybrid model is summarized by test and analysis. In this paper, the above work is described in detail, at the same time, the problems still existing in the research and the areas that need to be improved are reviewed.
【学位授予单位】:中国地质大学(北京)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.098

【相似文献】

相关期刊论文 前10条

1 慈新新,盛裕平,王韬;架设企业多网络域的邮件系统[J];软件世界;2000年07期

2 ;网络畅“邮”——常青藤邮件系统解决方案分析[J];每周电脑报;2000年25期

3 刘杰;商业化邮件系统:企业信息化第一应用[J];互联网周刊;2001年30期

4 ;邮件系统应用——聚焦企业级市场[J];微电脑世界;2002年15期

5 ;附加价值——企业邮件系统的真正目标[J];微电脑世界;2002年15期

6 ;擎空霹雳剑——在服务器端围剿垃圾邮件[J];微电脑世界;2003年07期

7 冯琳蔚;分布式抗垃圾邮件技术[J];计算机安全;2004年09期

8 晓齐;启明星辰推出 天澄防垃圾邮件系统[J];信息网络安全;2004年08期

9 郁冰;;大容量邮件系统的动力[J];电子商务世界;2006年04期

10 王冰睿;;从1小时到几秒钟 宜春改造公务员邮件系统见奇效[J];IT时代周刊;2009年24期

相关会议论文 前10条

1 孟广平;;分布式邮件系统特点及在宝钢的应用[A];第十一届全国自动化应用技术学术交流会论文集[C];2006年

2 刘华槟;;企业邮件系统的选型[A];创新·融合·发展——创新型煤炭企业发展与信息化高峰论坛论文集[C];2010年

3 刘阳;杨延新;郑铁成;;浅谈企业涉密邮件系统建设与改造[A];2013年中国航空学会管理科学分会学术会议论文集[C];2013年

4 吴哲;田捷;李亮;杨鑫;;基于指纹身份认证的安全邮件系统设计与实现[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年

5 李军辉;朱巧明;钱培德;;邮件语料库的语料添加算法研究与实现[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

6 黄斌;;第二代邮件系统[A];经济全球化和中国技术经济发展[C];2000年

7 寻晓劲;;邮件系统信息安全[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年

8 吴昊;;基于Lucene技术的邮件取证技术研究[A];第28次全国计算机安全学术交流会论文集[C];2013年

9 代刚;赵小宇;马严;;MailS(?)c智能安全邮件系统设计[A];全国计算机网络应用年会论文集(2001)[C];2001年

10 陈良臣;刘淑珍;闫晓飞;孙功星;;基于BERW和IMAP4的移动终端邮件系统的设计与开发[A];第13届全国计算机、网络在现代科学技术领域的应用学术会议论文集[C];2007年

相关重要报纸文章 前10条

1 本报记者 潘永花;邮件系统因需求而动[N];网络世界;2002年

2 姜姝;企业邮件系统如何确保安全[N];中国信息化周报;2013年

3 本报记者 陈凡;对付垃圾邮件有新招[N];北京科技报;2004年

4 梁剑坤;垃圾邮件可以消除[N];中国计算机报;2002年

5 本报记者 张超;垃圾邮件:互联网的烦恼[N];科技日报;2003年

6 小青;263积极打造邮件运营价值链[N];中国经营报;2004年

7 特约撰稿 张琦;垃圾邮件成“圣诞礼物”[N];中国电脑教育报;2006年

8 Mirapoint中国区技术经理 顾春;系统硬件化 构建安全邮件系统新趋势[N];中国计算机报;2006年

9 ;硕琦: 垃圾邮件行为模式分析[N];计算机世界;2006年

10 李玉华;企业邮件系统大升级[N];计算机世界;2007年

相关博士学位论文 前1条

1 李弋;云环境中典型应用的I/O优化策略研究[D];复旦大学;2012年

相关硕士学位论文 前10条

1 孙延涛;军队安全邮箱系统的设计与实现[D];山东大学;2015年

2 顾大伟;基于代理的敏感邮件监控技术研究[D];哈尔滨工业大学;2015年

3 曹家军;一种可接收短信的机顶盒系统的设计与实现[D];电子科技大学;2014年

4 江奇峰;办公邮件系统的设计与实现[D];华侨大学;2015年

5 吴o,

本文编号:2097457


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2097457.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e8b15***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com