电子邮件信息挖掘系统的设计与实现
发布时间:2017-05-07 19:04
本文关键词:电子邮件信息挖掘系统的设计与实现,由笔耕文化传播整理发布。
【摘要】:当今社会,电子邮件已经成为生活基本通信工具,人们通过发送电子邮件来开展相关事务。电子邮件类型有很多种,例如:工作邮件、生活邮件、广告邮件、垃圾邮件、欺诈邮件等。电子邮件一定程度上反映了人们在日常生活和工作中的信息传递需求。因而,对电子邮件中的信息进行挖掘有多方面的意义:通过邮件收发关系构建通信网络,可评估邮件中所反映的关系网络中的个体的地位、角色与能力;通过关联关系分析可发现邮件发送者的行为模式;通过应用社区划分、组织结构发现、缺失链路发现等复杂网络分析方法,可服务于组织结构绩效与能力评估、信息安全与公共安全等应用领域。本文针对电子邮件信息挖掘问题提出了关键性解决方案,并论述了该系统的设计与实现。 论文首先论述了项目背景,对比了国内外研究现状,在对项目的核心问题分析后确定了项目的研究目标。然后根据电子邮件信息挖掘过程中用户需要解决的问题得到系统的业务需求,进一步提取出功能需求和性能需求。在需求分析的基础上,对系统的总体架构和功能模块进行了划分。结合复杂网络分析方法的应用,本系统实现了电子邮件网络构建、事件发现、邮件扩散过程建模、频繁模式发现、社区划分等功能,同时利用GUI技术可视化挖掘结果,实现了与用户形象交互的功能需求。本文作者独立完成了以下工作:系统研究目标的确定;系统的需求分析和系统边界的确定;系统的架构设计、流程设计及数据库设计;系统所有功能模块的设计与实现;系统的功能测试和性能测试。 目前,本系统的功能模块已全部实现,并通过在安然数据集上的大量测试,验证了系统中核心算法的准确性。同时系统已经在某单位上线使用,得到了用户的积极反馈。
【关键词】:电子邮件 信息挖掘 复杂网络 事件发现
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.52
【目录】:
- 致谢4-5
- 摘要5-6
- ABSTRACT6-10
- 1 引言10-14
- 1.1 研究背景10
- 1.2 国内外研究现状10-11
- 1.3 研究目标11-12
- 1.4 论文主要工作12
- 1.5 论文组织结构12-13
- 1.6 本章小结13-14
- 2 相关理论与技术基础14-19
- 2.1 复杂网络分析相关理论和技术应用14-15
- 2.1.1 复杂网络简介14
- 2.1.2 社会网络简介14-15
- 2.1.3 社会网络建模方法的应用15
- 2.2 社区划分算法相关理论和技术应用15-16
- 2.3 关联规则挖掘算法相关理论和技术应用16-17
- 2.4 中文分词相关理论和技术应用17
- 2.5 本章小结17-19
- 3 系统需求分析19-29
- 3.1 系统用户识别19-20
- 3.2 系统功能性需求分析20-28
- 3.2.1 数据库配置用例分析20-21
- 3.2.2 数据预处理用例分析21-22
- 3.2.3 电子邮件信息挖掘用例分析22-23
- 3.2.4 数据模型配置用例分析23
- 3.2.5 软件参数配置用例分析23-24
- 3.2.6 邮件网络UI展示用例分析24-25
- 3.2.7 频繁模式发现信息展示用例分析25-26
- 3.2.8 社区划分UI展示用例分析26-27
- 3.2.9 邮件扩散UI展示用例分析27-28
- 3.3 系统非功能性需求分析28
- 3.4 本章小结28-29
- 4 系统概要设计29-37
- 4.1 系统架构设计29-30
- 4.2 系统功能结构设计30-31
- 4.3 数据库设计31-35
- 4.3.1 数据库选择32
- 4.3.2 E-R图设计32
- 4.3.3 数据库表设计32-35
- 4.4 开发与运行环境35
- 4.4.1 开发环境配置35
- 4.4.2 运行环境配置35
- 4.5 本章小结35-37
- 5 电子邮件信息挖掘算法模型设计37-45
- 5.1 电子邮件网络模型设计37-39
- 5.1.1 基本概念37
- 5.1.2 设计思路37-39
- 5.2 事件发现模型设计39-41
- 5.2.1 基本概念39
- 5.2.2 设计思路39-41
- 5.3 邮件扩散过程模型设计41-42
- 5.3.1 基本概念41
- 5.3.2 设计思路41-42
- 5.4 频繁模式发现模型设计42-44
- 5.4.1 基本概念43
- 5.4.2 设计思路43-44
- 5.5 本章小结44-45
- 6 系统详细设计与实现45-59
- 6.1 网络构建功能模块的设计与实现45-47
- 6.1.1 类的设计45-46
- 6.1.2 功能流程实现46-47
- 6.2 事件发现功能模块的设计与实现47-50
- 6.2.1 类的设计48
- 6.2.2 功能流程实现48-50
- 6.3 频繁模式发现功能模块的设计与实现50-52
- 6.3.1 类的设计50-51
- 6.3.2 功能流程实现51-52
- 6.4 邮件扩散UI展示功能模块的设计与实现52-55
- 6.4.1 类的设计52-54
- 6.4.2 功能流程实现54-55
- 6.5 界面展示55-57
- 6.6 本章小结57-59
- 7 系统测试59-66
- 7.1 功能测试59-62
- 7.2 性能测试62
- 7.3 实验结果验证62-65
- 7.3.1 事件发现实验结果验证62-64
- 7.3.2 邮件扩散过程实验结果验证64
- 7.3.3 频繁模式发现实验结果验证64-65
- 7.4 本章小结65-66
- 8 结论66-68
- 8.1 总结66
- 8.2 展望66-68
- 参考文献68-70
- 作者简历及攻读硕士学位期间取得的研究成果70-72
- 学位论文数据集72
【参考文献】
中国期刊全文数据库 前3条
1 方锦清,汪小帆,刘曾荣;略论复杂性问题和非线性复杂网络系统的研究[J];科技导报;2004年02期
2 周涛,柏文洁,汪秉宏,刘之景,严钢;复杂网络研究概述[J];物理;2005年01期
3 周涛,傅忠谦,牛永伟,王达,曾燕,汪秉宏,周佩玲;复杂网络上传播动力学研究综述[J];自然科学进展;2005年05期
本文关键词:电子邮件信息挖掘系统的设计与实现,由笔耕文化传播整理发布。
,本文编号:350403
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/350403.html