企业级邮件处理系统的设计与实现
本文关键词:企业级邮件处理系统的设计与实现,由笔耕文化传播整理发布。
【摘要】:邮件是企业办公的一种重要通信工具,出于企业安全和独立邮件域可作为企业标签的考虑,很多企业都使用独立的邮件系统。因此一个优秀的邮件处理系统对企业而言有重要意义。本文实现了一个企业级的邮件处理系统,在支持垃圾邮件过滤之余,支持联系人检测从而自动识别重要邮件,且结合云存储的思路创新性地提出邮件内容自动归档管理。其中联系人检测创新性地支持域联系人,则可简单地将某个域设置为联系人,避免用户过多介入联系人的配置;邮件内容自动归档指可根据用户设定的联系人规则、关键词规则自动将邮件正文或附件归档到云盘。系统的垃圾邮件过滤功能主要基于多个可插拔的垃圾过滤处理模块来实现,以优秀的开源垃圾邮件过滤项目Spam Assassin为核心模块,实现了SPF、病毒过滤、黑名单和蜜罐邮件等模块,且支持并发控制、频率控制和邮件特征控制。本文针对中文邮件对Spam Assassin进行了简单调优,且结合特征提取及神经网络算法为Spam Assassin实现了根据训练集自动生成中文关键词规则的工具,该工具可解决官方未提供中文关键词规则的问题。本文将系统架构设计进行了合理的解耦,同时系统基于异步事件驱动网络模型和协程来实现。测试结果显示,本系统表现出了良好的性能。另外支持可插拔的模块设计使得本系统具备了高可维护性、易于扩展性,而基于RESTful的管理服务,使得系统可支持多种终端管理。
【关键词】:邮件处理系统架构设计 联系人邮件 邮件归档 Spam Assassin中文规则
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.098
【目录】:
- 摘要5-6
- Abstract6-10
- 第一章 绪论10-15
- 1.1 研究背景10-11
- 1.2 主要研究工作11-14
- 1.2.1 研究内容与目标11-13
- 1.2.2 研究思路13
- 1.2.3 研究意义13-14
- 1.3 本文结构14-15
- 第二章 邮件相关协议介绍与邮件分类技术的现状15-24
- 2.1 邮件的工作原理15-18
- 2.1.1 SMTP协议15-16
- 2.1.2 POP3/IMAP协议16-17
- 2.1.3 MIME协议17-18
- 2.1.4 DNS的MX记录18
- 2.2 垃圾过滤常用技术18-22
- 2.2.1 依据邮件的工作原理采取限制措施或过滤手段18-20
- 2.2.2 基于内容的过滤20-21
- 2.2.3 基于行为的过滤21-22
- 2.3 非垃圾邮件中重要邮件识别技术的现状22-23
- 2.4 邮件附件管理的现有方案所存在的问题23
- 2.5 本章小结23-24
- 第三章 系统架构的设计与实现24-37
- 3.1 系统目标概述24-25
- 3.1.1 系统功能目标概述24-25
- 3.1.2 系统性能目标概述25
- 3.2 系统运行逻辑分析25-27
- 3.2.1 用户的使用模式25
- 3.2.2 服务的运行逻辑25-27
- 3.3 系统架构设计27-28
- 3.4 接收节点的实现28-30
- 3.5 处理节点的架构实现30-33
- 3.6 归档节点的实现33-35
- 3.6.1 云盘WebLib系统的介绍33-34
- 3.6.2 邮件归档的实现34-35
- 3.7 管理配置的RESTful服务的实现35-36
- 3.8 本章小结36-37
- 第四章 处理节点的核心模块的实现37-46
- 4.1 处理节点的模块概述37-39
- 4.2 辅助模块的实现39-40
- 4.3 垃圾过滤模块的实现40-42
- 4.3.1 SpamAssassin过滤模块的实现40-41
- 4.3.2 SPF过滤模块的实现41
- 4.3.3 黑名单过滤与蜜罐模块的实现41
- 4.3.4 病毒过滤模块的实现41-42
- 4.4 非垃圾邮件分类技术的实现42-45
- 4.4.1 联系人检测识别重要邮件模块的实现42-44
- 4.4.2 用户自定义收件规则的实现44-45
- 4.5 本章小结45-46
- 第五章 基于SpamAssassin的过滤中文垃圾邮件实践46-62
- 5.1 SpamAssassin的原理介绍46-47
- 5.1.1 SpamAssassin的工作原理46-47
- 5.1.2 SpamAssassin的过滤规则的格式47
- 5.2 过滤效果的评估指标与数据集介绍47-49
- 5.3 基于中文邮件的Spamassasin手动调优49-53
- 5.3.1 针对中文邮件进行规则的手动调优50-52
- 5.3.2 SpamAssassin过滤SEWM2011 效果不佳的原因分析52
- 5.3.3 再验证SpamAssassin的中文过滤效果52-53
- 5.4 SpamAssassin中文关键词规则的自动生成工具的设计与实现53-60
- 5.4.1 常见文本特征提取算法的介绍54-55
- 5.4.2 规则赋值官方神经网络算法的介绍55-56
- 5.4.3 中文关键词规则自动生成工具的设计与实现56-58
- 5.4.4 自动生成的中文关键词规则的过滤效果评估58-60
- 5.5 本章小结60-62
- 第六章 系统测试62-71
- 6.1 系统功能测试结果62-66
- 6.2 系统性能测试方案66-67
- 6.3 系统性能测试结果及其分析67-70
- 6.3.1 响应时间评估67-68
- 6.3.2 延迟时间评估68-69
- 6.3.3 吞吐量评估69-70
- 6.4 本章小结70-71
- 全文结语71-73
- 参考文献73-75
- 附录一 协程及线程的切换开销比较的实验代码75-76
- 附录二 针对SEWM2011 禁用的规则及其描述76-78
- 附录三 基于性能考虑而禁用的规则78-79
- 攻读硕士学位期间取得的研究成果79-80
- 致谢80-81
- 附件81
【参考文献】
中国期刊全文数据库 前10条
1 徐锐;;DKIM技术在反垃圾邮件技术中的应用[J];电大理工;2012年02期
2 吴旭东;;高性能Linux网络服务器设计与实现[J];电脑编程技巧与维护;2011年20期
3 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
4 李涛;陈瑛;黎志生;杨道全;;高校实验室数字资产管理与共享系统[J];广西大学学报(自然科学版);2011年S1期
5 万立夫;;将Gmail附件保存到网络硬盘[J];电脑迷;2013年08期
6 詹川;卢显良;侯孟书;邢茜;;一种快速的基于URL的垃圾邮件过滤系统[J];计算机科学;2005年08期
7 陈光英;孙东红;;实现基于SpamAssassin的中文垃圾邮件过滤网关[J];中国教育网络;2005年11期
8 隆承志;董守斌;许勇;;智能的邮件处理系统Matrix——华南理工大学反垃圾邮件处理系统介绍[J];中国教育网络;2008年06期
9 方卫东;董守斌;隆承志;;如何评测系统性能?[J];中国教育网络;2008年06期
10 蓝炳伟;;SPF技术在邮件服务系统中的应用[J];计算机系统应用;2006年10期
中国硕士学位论文全文数据库 前5条
1 蔡炯;邮件网关过滤系统的研究[D];电子科技大学;2007年
2 黄志刚;基于贝叶斯的中文垃圾邮件过滤系统的设计与实现[D];电子科技大学;2007年
3 孙晶涛;基于LSA和MD5算法的垃圾邮件过滤系统研究[D];兰州理工大学;2008年
4 谢佳明;企业文档管理系统的设计与实现[D];华南理工大学;2012年
5 姜南;基于SVM的垃圾邮件在线过滤新方法[D];吉林大学;2013年
本文关键词:企业级邮件处理系统的设计与实现,由笔耕文化传播整理发布。
,本文编号:371991
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/371991.html