基于KNN-SVM的垃圾邮件过滤模型
本文关键词:基于KNN-SVM的垃圾邮件过滤模型
更多相关文章: 垃圾邮件 模式识别提取 K近邻算法 特征提取
【摘要】:垃圾邮件具有特征维数高、样本不平衡等特点,针对近邻算法(KNN)或支持向量机(SVM)存在虚警率高等难题,基于组合优化理论,提出基于KNN-SVM的垃圾邮件过滤组合模型。首先提取垃圾邮件的特征项,并构建垃圾邮件过滤模型的输入向量,然后采用KNN对垃圾邮件训练样本进行选择,将训练样本缩减到k个,并采用支持向量机对k个样本训练和建模进行垃圾邮件过滤,最后采用中文邮件集对KNN-SVM的性能进行分析。结果表明,KNN-SVM提高了垃圾邮件过滤的准确率,大幅度降低了虚警率,而且垃圾邮件的过滤速度可以满足邮件处理的在线需求。
【作者单位】: 常州大学怀德学院;
【关键词】: 垃圾邮件 模式识别提取 K近邻算法 特征提取
【分类号】:TP393.098
【正文快照】: 0引言电子邮件(Email)是包含文字、图像、视频的特殊文本,已经成为网络上交流、沟通的工具[1]。大量统计与研究报告表明,垃圾邮件占了全世界邮件的50%以上,对人们生活、工作带来了干扰,而且浪费了大量的网络带宽[2]。提高垃圾邮件过滤的准确率,保证信息安全,引起了人们的广泛
【相似文献】
中国期刊全文数据库 前10条
1 张羿;周建国;晏蒲柳;;垃圾邮件过滤系统的研究与实现[J];计算机工程;2006年18期
2 徐卫;;一种垃圾邮件过滤网关的设计[J];电脑知识与技术;2006年35期
3 项涛;龚俭;丁伟;;垃圾邮件过滤系统的评估模型研究[J];计算机工程与设计;2007年18期
4 欧德宁;马军;;基于内含链接特征分析的垃圾邮件过滤技术[J];郑州大学学报(理学版);2009年02期
5 金彩琴;裘国永;;对垃圾邮件过滤技术的问题研究[J];计算机技术与发展;2011年09期
6 丁上凌;吕后坤;;垃圾邮件过滤技术研究[J];漯河职业技术学院学报;2012年02期
7 赵文清;一种混合型垃圾邮件过滤系统的研究与设计[J];山西电子技术;2004年06期
8 陈长伟;刘罡;洪跃枫;;电子垃圾邮件过滤技术的应用[J];办公自动化;2004年06期
9 刘震,佘X,周明天;基于多级属性集的垃圾邮件过滤技术[J];计算机应用研究;2005年07期
10 陈治平;王雷;;基于自学习K近邻的垃圾邮件过滤算法[J];计算机应用;2005年S1期
中国重要会议论文全文数据库 前10条
1 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 潘文锋;王斌;谭松波;;贝叶斯垃圾邮件过滤研究[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
3 刘红翼;;一种垃圾邮件过滤器的设计与实现[A];广西计算机学会2005年学术年会论文集[C];2005年
4 张尼;方滨兴;;垃圾邮件过滤技术综述[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
5 张志斌;施水才;吕学强;;基于贝叶斯方法的中文垃圾邮件过滤技术综述[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年
7 张海雷;王会珍;王安慧;朱靖波;;基于朴素贝叶斯模型的垃圾邮件过滤技术比较分析[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
8 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
9 岑芳明;王明文;王鹏鸣;戴玉娟;;基于核偏最小二乘分类的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 牛明珠;;病毒和垃圾邮件过滤技术浅析[A];二○○九年全国电力企业信息化大会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 ;测试垃圾邮件过滤系统[N];网络世界;2003年
2 ;如何选择和使用UTM设备[N];网络世界;2009年
3 本报记者 朱杰;中小企业网络也能云安全[N];中国计算机报;2009年
4 宋伟;终结混合威胁攻击[N];中国计算机报;2004年
5 本报记者 宋丽娜;整合安全平台的魅力[N];网络世界;2004年
6 湖北 张湘凯;慎用Web邮箱过滤功能[N];电脑报;2002年
7 张振;CA eTrust Secure Content Manager提升运营效率[N];电脑商报;2003年
8 雷雷;如虎添翼加入UTM的3D-SMP[N];科技日报;2006年
9 记者 马霞;下一代防火墙整体性能达320G[N];科技日报;2012年
10 ;FCI过滤恶意流量[N];中国计算机报;2004年
中国博士学位论文全文数据库 前4条
1 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
2 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
3 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
4 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 甘棠仪;基于属性论方法的垃圾邮件过滤系统设计与研究[D];上海海事大学;2005年
2 王申;基于内容的垃圾邮件过滤技术的若干研究[D];中国科学院研究生院(计算技术研究所);2005年
3 田月霞;基于疫苗机制的垃圾邮件过滤模型的研究[D];郑州轻工业学院;2015年
4 许建明;基于内容挖掘的中文垃圾邮件过滤技术研究与实现[D];湖南大学;2008年
5 郑梅;基于规则的垃圾邮件过滤系统设计与实现[D];电子科技大学;2008年
6 王鹏鸣;基于偏最小二乘方法的垃圾邮件过滤研究[D];江西师范大学;2008年
7 陈俊伟;图片垃圾邮件过滤系统[D];华东师范大学;2009年
8 徐隽;基于流数据特性的垃圾邮件过滤技术研究[D];复旦大学;2009年
9 林伟;基于贝叶斯分类的垃圾邮件过滤系统研究与实现[D];西华大学;2009年
10 徐熙;基于内容的多级垃圾邮件过滤系统研究[D];西华大学;2009年
,本文编号:829166
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/829166.html