基于链接挖掘的邮件网络中心性研究
发布时间:2017-11-29 08:06
本文关键词:基于链接挖掘的邮件网络中心性研究
【摘要】:在信息高速传播的互联网时代,电子邮件是大部分组织和公司正式通信的方式。邮件数据库中蕴含着大量未被挖掘的有用信息,是关于人类活动的隐形知识仓库。电子邮件通信模式很早就被用来获得底层社会网络结构,通过观察谁和谁通信以及通信频率,邮件关系网络可以和社交网络相互映射。在网络信息安全问题日益突出的今天,挖掘一个人的邮件数据库可以提供不同维度下关于他或她有价值的活动的视角,所以邮件网络分析也常常被应用于发现社团组织和信息传播模式,识别犯罪欺诈活动和犯罪组织中的关键成员。本课题来源于实验室的研发项目,通过研究邮件网络中心性,挖掘出公司或组织里的社团结构,定位核心人物。本文基于智能邮件分析平台研究邮件网络中心性,对Enron公司邮件数据库进行整理,通过可视化的方式展现邮件网络各方面特性,直观的演示了实验效果。系统主要开发了邮件检索,邮件网络分析,社团发现和信息要素分析等模块,进一步验证改进的PageRank算法的实用性。在已有的邮件网络中心化研究中,由于传统的PageRank算法对网络扰动较为敏感,较多关注于评估节点级和链接级的参数,容易受到度值高的干扰节点影响。本文利用复杂网络中心化指标中的核数来分解邮件网络各层,以剔除外层干扰节点,在保留重要成员的基础上减少网络节点规模,降低后续挖掘算法复杂度,并引入了改进的PageRank算法,以解决权值分配偏移问题,定量分析网络核心层的节点并排序,找出电子邮件网络中的重要节点。通过邮件网络中心性挖掘实验表明,该方法能降低算法复杂度,提高有效性。
【学位授予单位】:北京化工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.098
【参考文献】
中国硕士学位论文全文数据库 前1条
1 彭玲;基于主题及核心人物的邮件网络社区发现研究[D];苏州大学;2010年
,本文编号:1236743
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1236743.html