基于社会计算和机器学习的垃圾邮件识别方法的研究
本文选题:社会计算 + 垃圾邮件识别 ; 参考:《山东大学学报(理学版)》2013年07期
【摘要】:在对目前各种垃圾邮件识别方法进行研究分析的基础上,结合社会计算的理论和机器学习的方法,提出了一种新的垃圾邮件识别方法。通过利用邮件头部中能反映联系人社会关系的特征来构造一张联系人来往关系图对垃圾邮件进行初次识别,对于无法确定存在社会关系的联系人的邮件再利用机器学习的方法进行识别。实验结果表明,采用该方法进行垃圾邮件识别较之单纯采用贝叶斯方法,识别准确率有了较大的提高,同时,识别时间得到降低。
[Abstract]:Based on the research and analysis of the current methods of spam identification, a new method of spam recognition is proposed by combining the theory of social computing and the method of machine learning. By making use of the characteristics of the contact relationship in the email header to construct a contact relationship graph, the spam is first identified. Email for contacts who cannot determine the existence of social relations is then identified by machine learning. The experimental results show that the accuracy of spam identification using this method is much higher than that of Bayesian method, and the recognition time is reduced.
【作者单位】: 北京信息科技大学计算机学院;北京信息科技大学网络文化与数字传播北京市重点实验室;
【基金】:国家自然科学基金资助项目(60973107) 网络文化与数字传播北京市重点实验室资助项目(ICDD201106) 国家社会科学基金重大项目(12&ZD234) 网络文化与数字传播北京市重点实验室开放课题(ICDD201207)
【分类号】:TP393.098
【参考文献】
相关期刊论文 前7条
1 李星;田莹;段海新;;中文垃圾邮件过滤系统的实现和评估[J];大连理工大学学报;2005年S1期
2 刘萍,谭建龙,沙瀛;针对垃圾邮件的直接多关键词匹配算法[J];计算机工程;2005年13期
3 赵静;刘培玉;许明英;;邮件过滤中特征选择方法的性能评价与分析[J];计算机应用研究;2012年02期
4 王斌,潘文锋;基于内容的垃圾邮件过滤技术综述[J];中文信息学报;2005年05期
5 彭玲;徐汀荣;乔志伟;;基于核心图聚类的邮件网络社区发现[J];微型机与应用;2010年17期
6 胡燕;滕桂法;董素芬;王聃;;基于MIME邮件结构的邮件内容提取技术的研究[J];现代图书情报技术;2008年05期
7 高丽平;高亮;;基于词汇扩展的垃圾邮件过滤方法[J];中原工学院学报;2009年06期
相关硕士学位论文 前2条
1 黄胜宇;有向赋权邮件社团结构发现研究[D];苏州大学;2011年
2 张茜;电子邮件网络中的社团挖掘研究[D];华东理工大学;2012年
【共引文献】
相关期刊论文 前10条
1 程卫华;尤晋元;;基于内容过滤的反垃圾邮件系统的设计与实现[J];安徽大学学报(自然科学版);2007年03期
2 黄文良;李石坚;刘菊新;徐从富;;一个大规模垃圾短信实时过滤系统[J];北京邮电大学学报;2008年03期
3 董振兴;李荣;陈龙;;一种基于主动学习和TCM-EKNN的邮件过滤方法[J];重庆邮电大学学报(自然科学版);2011年01期
4 邓文韬;王国胤;董振兴;;一种改进KNN个性化邮件过滤的方法[J];重庆邮电大学学报(自然科学版);2011年06期
5 刘洋;曹津宁;刘昊;秦玉平;;基于贝叶斯方法的垃圾邮件处理模型研究[J];长春工程学院学报(自然科学版);2007年03期
6 沈竞;蒋侨;;DSTFA分布式短文本过滤算法[J];四川兵工学报;2011年10期
7 田林;;基于SMTP会话控制的主动式垃圾邮件过滤技术的研究[J];楚雄师范学院学报;2009年06期
8 孙晶涛;张秋余;袁占亭;董建设;;博弈论在邮件特征选择中的应用[J];电子科技大学学报;2011年01期
9 庄锁法;陈兴梅;;客户端防范垃圾邮件策略的探讨[J];电脑知识与技术;2006年23期
10 徐卫;;一种垃圾邮件过滤网关的设计[J];电脑知识与技术;2006年35期
相关会议论文 前7条
1 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
2 张艳;李毅;顾健;;垃圾邮件与反垃圾邮件新技术追踪[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
3 赵利;廖闻剑;彭艳兵;;基于中文主题的垃圾邮件过滤方法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年
4 黄文良;李石坚;刘菊新;徐从富;;大规模垃圾短信实时过滤系统的设计与实现[A];中国通信学会第五届学术年会论文集[C];2008年
5 苏绥;林鸿飞;叶正;;基于字符语言模型的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
7 吴昊;;基于Lucene技术的邮件取证技术研究[A];第28次全国计算机安全学术交流会论文集[C];2013年
相关博士学位论文 前10条
1 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
2 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
3 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
4 曹渝昆;基于神经网络和模糊逻辑的智能推荐系统研究[D];重庆大学;2006年
5 岳训;面向流数据特征提取的人工免疫网络模型研究[D];大连理工大学;2006年
6 何申;面向3G移动通信网络的安全框架研究[D];中国科学技术大学;2007年
7 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
8 黄文良;垃圾短信过滤关键技术研究[D];浙江大学;2008年
9 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年
10 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
相关硕士学位论文 前10条
1 岳广飞;基于二次搜索的搜索引擎技术研究[D];山东科技大学;2010年
2 刘维会;不平衡数据集上支持向量机算法研究[D];山东科技大学;2010年
3 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
4 李福转;基于内容的垃圾邮件过滤技术的研究[D];电子科技大学;2010年
5 石晶;一种高效垃圾短信过滤系统的实现[D];电子科技大学;2010年
6 苏保君;在线组合分类器应用于大规模垃圾邮件过滤的研究[D];浙江大学;2010年
7 江华丽;基于嵌入式与神经网络的邮件过滤系统设计[D];福建师范大学;2010年
8 徐丽平;基于内容挖掘的中文垃圾邮件过滤技术研究[D];东北财经大学;2010年
9 王海波;垃圾短信的屏蔽机制与应用研究[D];东华大学;2011年
10 陈强;基于贝叶斯方法的垃圾邮件过滤技术的研究[D];沈阳工业大学;2011年
【二级参考文献】
相关期刊论文 前10条
1 李星;田莹;段海新;;中文垃圾邮件过滤系统的实现和评估[J];大连理工大学学报;2005年S1期
2 赵晓明,郑少仁;电子邮件过滤器的分析与设计[J];东南大学学报(自然科学版);2001年05期
3 张长君;电子邮件的一种过滤方法[J];计算机安全;2002年02期
4 单丽莉;刘秉权;孙承杰;;文本分类中特征选择方法的比较与改进[J];哈尔滨工业大学学报;2011年S1期
5 落红卫,刘建毅,王枞,钟义信;智能邮件过滤系统的研究与实现[J];机电产品开发与创新;2003年01期
6 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
7 靖红芳;王斌;杨雅辉;徐燕;;基于类别分布的特征选择框架[J];计算机研究与发展;2009年09期
8 单松巍,冯是聪,李晓明;几种典型特征选取方法在中文网页分类上的效果比较[J];计算机工程与应用;2003年22期
9 王清翔;广凯;潘金贵;;基于支持向量机的邮件过滤[J];计算机科学;2007年09期
10 闫鹏;郑雪峰;李明祥;陈松华;;二值文本分类中基于Bayes推理的特征选择方法[J];计算机科学;2008年07期
相关博士学位论文 前1条
1 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
相关硕士学位论文 前2条
1 张晓冬;电子邮件的社区挖掘技术研究[D];国防科学技术大学;2007年
2 彭玲;基于主题及核心人物的邮件网络社区发现研究[D];苏州大学;2010年
【相似文献】
相关期刊论文 前10条
1 李雯;刘培玉;;基于贝叶斯的垃圾邮件过滤算法的研究[J];计算机工程与应用;2007年23期
2 张秋余;李建建;余冬梅;董建设;王静;贺洋伟;;基于图像相似性检测的图像垃圾邮件过滤方法[J];兰州理工大学学报;2008年04期
3 李融,曹小春;浅析反垃圾电子邮件技术[J];科技创业月刊;2004年06期
4 卓高明;林世平;;邮件过滤中信息增益方法的改进[J];计算机工程与应用;2006年S1期
5 叶振宇,刘晶;基于模糊模式识别的中文邮件过滤探讨[J];计算机时代;2004年11期
6 林祥,荆涛,李生红;前置式邮件过滤系统的设计与实现[J];计算机工程与应用;2005年02期
7 熊忠阳;杜圣东;张玉芳;;一种改进的支持向量机邮件分类器[J];计算机科学;2007年09期
8 陆青梅;尹四清;;基于贝叶斯定理的垃圾邮件分类技术研究[J];信息技术;2008年02期
9 尹军,谭晓兰;校园网络中如何防范垃圾邮件[J];衡阳师范学院学报;2005年03期
10 石艳荣;;反垃圾邮件技术[J];内蒙古石油化工;2006年01期
相关会议论文 前10条
1 张相於;陈继东;李玉坤;孟小峰;;TEXEM:一种基于实体的邮件任务提取策略[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 张晶;姚建民;董守斌;张凌;;基于自然语言同现词汇的邮件过滤[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 张志斌;施水才;吕学强;;基于贝叶斯方法的中文垃圾邮件过滤技术综述[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 沈卫超;;反垃圾邮件技术与产品分析[A];第二十次全国计算机安全学术交流会论文集[C];2005年
5 仇小锋;陈鸣;贾永兴;;垃圾邮件及其防范技术[A];第九届全国青年通信学术会议论文集[C];2004年
6 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
7 顾琳;;利用Foxmail辅助电子审稿[A];第四届全国核心期刊与期刊国际化、网络化研讨会论文集[C];2006年
8 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
9 赖均;黄迪明;胡德昆;;反垃圾邮件机的研究与实现[A];四川省通信学会二零零四年学术年会论文集(二)[C];2004年
10 沈卫超;;邮件过滤器系统的设计与实现[A];中国工程物理研究院科技年报(2001)[C];2001年
相关重要报纸文章 前10条
1 乔珊;备份你的邮件过滤规则[N];电脑报;2004年
2 郑惠荣;利用人工智能进行邮件过滤[N];中国计算机报;2003年
3 ;冠群金辰赤宵KILL邮件过滤网关— 采用独立的硬件平台杀毒[N];计算机世界;2003年
4 黄智军;IronMail帮保险业过滤邮件[N];计算机世界;2007年
5 唐慧;让电子邮件更安全[N];网络世界;2002年
6 ;不止是垃圾邮件过滤[N];网络世界;2005年
7 温远;构筑E-mail安全堡垒[N];中国电子报;2003年
8 《计算机世界》评测实验室 李韬;构建一体化安全方案[N];计算机世界;2006年
9 吴倩;让E-mail更安全[N];中国计算机报;2002年
10 ;Sobig.F缘何成为网络[杀手][N];中国电脑教育报;2003年
相关博士学位论文 前10条
1 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
2 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
3 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
4 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
5 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
6 董大凡;基于度量空间的P2P网络相似搜索技术研究及应用[D];南开大学;2010年
7 程红蓉;垃圾图像特征提取与选择研究[D];电子科技大学;2011年
8 李鹏;图像型垃圾邮件过滤关键技术研究[D];哈尔滨工业大学;2013年
9 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
10 卢敏;具有自然分组特性文本的分类研究[D];南开大学;2013年
相关硕士学位论文 前10条
1 杨大伟;基于Sendmail的电子邮件网关系统设计与实现[D];哈尔滨工程大学;2005年
2 李学勇;基于三层网络设备的邮件过滤系统[D];华北工学院;2003年
3 杨盛;电子邮件过滤系统的研究与设计[D];中南大学;2005年
4 吕栗;邮件过滤系统中数据库的性能优化[D];哈尔滨工程大学;2005年
5 肖明;基于SVM的智能邮件过滤系统研究与实现[D];电子科技大学;2005年
6 杨丽华;基于内容的垃圾邮件过滤技术研究[D];西南交通大学;2006年
7 徐卫;电子邮件预处理与过滤管理系统的研究与设计[D];苏州大学;2006年
8 石霞军;邮件信息过滤算法研究与实现[D];湖南大学;2002年
9 周俊怡;一种混合垃圾邮件过滤技术研究[D];电子科技大学;2009年
10 林昊;基于Linux内核的邮件过滤系统的研究与实现[D];电子科技大学;2005年
,本文编号:2070717
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2070717.html