基于Boosting算法的垃圾邮件过滤方法研究
发布时间:2018-06-05 06:42
本文选题:Boosting算法 + 垃圾邮件 ; 参考:《北京理工大学学报》2013年01期
【摘要】:为解决垃圾邮件过滤的精确度和有效性问题,提出了一种基于邮件内容过滤的垃圾邮件过滤方法,该方法采用Boosting算法构造了一种垃圾邮件过滤器,利用该垃圾邮件过滤器实现对垃圾邮件的过滤.本文借鉴文本分类和信息检索领域所使用的评价指标,构建了垃圾邮件过滤器的评价体系,利用该评价体系,针对基于Boosting算法所构造的垃圾邮件过滤器对垃圾邮件的过滤实验所得到的数据进行了测试和评估,测试和评估的结果验证了Boosting算法在垃圾邮件过滤中的有效性,其性能优于传统的贝叶斯算法.
[Abstract]:In order to solve the problem of accuracy and validity of spam filtering, a spam filtering method based on email content filtering is proposed, which uses Boosting algorithm to construct a spam filter. The spam filter is used to filter spam. Based on the evaluation indexes used in the field of text classification and information retrieval, the evaluation system of spam filter is constructed in this paper. The data of spam filter based on Boosting algorithm is tested and evaluated. The result of test and evaluation verifies the validity of Boosting algorithm in spam filtering. Its performance is superior to the traditional Bayesian algorithm.
【作者单位】: 齐齐哈尔大学应用技术学院;齐齐哈尔大学网络信息中心;北京首都国际机场股份有限公司;林甸县第一中学;
【基金】:黑龙江齐齐哈尔市科学技术计划项目(GYGG2010-06-02)
【分类号】:TP393.098
【参考文献】
相关期刊论文 前1条
1 曾春,邢春晓,周立柱;基于内容过滤的个性化搜索算法[J];软件学报;2003年05期
相关硕士学位论文 前1条
1 潘文锋;基于内容的垃圾邮件过滤研究[D];中国科学院研究生院(计算技术研究所);2004年
【共引文献】
相关期刊论文 前10条
1 张玉霞;;改进的个性化智能文献推送方法在数字图书馆中的应用研究[J];情报理论与实践;2012年07期
2 蒋宗礼,肖华,赵钦;WebSifter:个性化网络搜索辅助系统[J];清华大学学报(自然科学版);2005年S1期
3 王鑫;陈光英;段海新;李学农;;基于用户反馈和增量学习的垃圾邮件识别方法[J];清华大学学报(自然科学版);2006年01期
4 杨献峰;侯志松;;基于Agent的搜索引擎个性化服务系统[J];软件导刊;2008年03期
5 沈杰峰,杜亚军,唐俊;基于蚁群算法的网页推荐[J];西华大学学报(自然科学版);2005年06期
6 宋宇;;网络资源定题采集系统设计与实现[J];山东图书馆学刊;2010年02期
7 陈枭;刘天华;朱宏峰;刘骏;;基于词汇相关度模型的个性化元搜索引擎[J];计算机工程与设计;2007年19期
8 羊晶t,
本文编号:1981018
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1981018.html