基于RSSI的贝叶斯垃圾邮件过滤算法
本文关键词:基于RSSI的贝叶斯垃圾邮件过滤算法
更多相关文章: 邮件分类 贝叶斯分类器 特征提取 多项式事件模型 过拟合
【摘要】:针对现有贝叶斯算法应用于垃圾邮件过滤时,贝努利模型精度低、不能区分文本特征重要性、多项式模型计算量大、无关特征项浪费计算时间、对出现次数少的特征项反应敏感等缺点,提出RSSI(remove similar and sensitive items)特征模型。通过计算并比较特征项出现的频率,去除无关和敏感特征项,减小运算量,增加正确率,减少过拟合。Matlab仿真结果表明,与现有的朴素贝叶斯算法(na錵ve Bayes)和支持向量机(support vector machine,SVM)等算法相比,RSSI算法能显著减少分类时间,降低合法邮件被误判的概率。
【作者单位】: 郑州大学电气工程学院;
【基金】:教育部高等学校博士学科点专项科研基金项目(20114101110005)
【分类号】:TP393.098
【正文快照】: 0引言基于内容的垃圾邮件过滤法比一般白名单与黑名单技术、规则过滤以及基于关键词匹配的内容扫描等智能化程度高,可采用属于有监督学习的朴素贝叶斯分类器,实践结果表明分类效果佳。其中,贝叶斯过滤器是基于文本的过滤技术,准确率较高,但是,现有朴素贝叶斯分类器基于一个假
【参考文献】
中国期刊全文数据库 前5条
1 刘红芝;;中文分词技术的研究[J];电脑开发与应用;2010年03期
2 杨凯峰;张毅坤;李燕;;基于文档频率的特征选择方法[J];计算机工程;2010年17期
3 符会涛;卡米力·木衣丁;;一种改进的文本特征选择方法的研究与设计[J];计算机应用与软件;2011年04期
4 郑冬冬;宋顺林;;图片垃圾邮件过滤技术综述[J];计算机工程与设计;2010年01期
5 李潇;罗军勇;尹美娟;;基于结构特征分析与文本分类的邮件筛选[J];计算机工程与设计;2010年21期
【共引文献】
中国期刊全文数据库 前10条
1 于洪波;;中文分词技术研究[J];东莞理工学院学报;2010年05期
2 陈玫;蒙祖强;;面向医学知识的中文分词词典设计与实现[J];大众科技;2010年11期
3 陈凯星;陈建英;;一种改进的基于朴素贝叶斯算法的垃圾短信过滤技术[J];福建电脑;2014年03期
4 张宇;汪丰;黄海诚;乔子晏;;基于Web的高血压非药物治疗知识库构建[J];工业控制计算机;2014年05期
5 谢小民;;基于贝叶斯的垃圾邮件过滤算法设计研究[J];电子技术与软件工程;2014年15期
6 郭俊枫;赵仁亮;郑娇龙;;面向网页文本的地理要素变化发现[J];地理信息世界;2015年01期
7 胡龙茂;;中文文本分类技术比较研究[J];安庆师范学院学报(自然科学版);2015年02期
8 陈二恒;贺德强;刘建仁;向伟彬;周继续;;基于小波包和贝叶斯分类的机车走行部滚动轴承故障诊断研究[J];铁道科学与工程学报;2015年03期
9 武毅;钟志农;;基于Lucene.Net的安全信息系统全文检索引擎的设计与实现[J];计算机与信息技术;2011年Z2期
10 王刚;刘元宁;张晓旭;赵正东;朱晓冬;刘震;;基于模糊自适应粒子群的垃圾邮件过滤新方法[J];吉林大学学报(工学版);2011年03期
中国重要会议论文全文数据库 前1条
1 邓蔚;秦志光;;基于Kolmogorov复杂性的垃圾信息过滤研究综述[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
中国博士学位论文全文数据库 前6条
1 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
2 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
3 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
4 宋强;中国互联网低俗内容监管研究[D];北京邮电大学;2012年
5 夏虎;移动社交网络结构和行为研究及其应用[D];电子科技大学;2012年
6 董坚峰;面向公共危机预警的网络舆情分析研究[D];武汉大学;2013年
中国硕士学位论文全文数据库 前10条
1 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
2 胡少荣;一种舆情信息预处理平台的研究与实现[D];北京交通大学;2010年
3 戴雪梅;面向购物的聚类搜索引擎的研究与实现[D];北京交通大学;2011年
4 王荣;智能手机入侵检测系统的研究[D];北京交通大学;2011年
5 王询;面向航运领域的文本分类系统[D];大连海事大学;2011年
6 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
7 徐西孟;基于OODA决策循环的主题发现技术的研究与设计[D];济南大学;2011年
8 符会涛;基于互信息的文本自动分类特征选择方法研究[D];新疆大学;2011年
9 董平;关联特征提取与贝叶斯网络的文本分类研究[D];华南理工大学;2011年
10 王超;基于图像底层特征的图像型垃圾邮件识别研究[D];电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
2 孙铁利,杨凤芹;根据用户隐式反馈建立和更新用户兴趣模型[J];东北师大学报(自然科学版);2003年03期
3 何培舟;温向明;郑伟;;图像垃圾邮件的发展和防范[J];电信科学;2008年07期
4 于金龙,李晓红,孙立新;连续属性值的整体离散化[J];哈尔滨工业大学学报;2000年03期
5 林珊,宁国宁,赵之霖;中文分词在邮件过滤系统中的应用[J];华南理工大学学报(自然科学版);2004年S1期
6 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期
7 谭琼,史忠植;分词中的歧义处理[J];计算机工程与应用;2002年11期
8 单松巍,冯是聪,李晓明;几种典型特征选取方法在中文网页分类上的效果比较[J];计算机工程与应用;2003年22期
9 徐凤亚,罗振声;文本自动分类中特征权重算法的改进研究[J];计算机工程与应用;2005年01期
10 吕震宇;林永民;赵爽;陈景年;朱卫东;;基于类信息的文本特征选择与加权算法研究[J];计算机工程与应用;2008年20期
中国硕士学位论文全文数据库 前2条
1 潘文锋;基于内容的垃圾邮件过滤研究[D];中国科学院研究生院(计算技术研究所);2004年
2 李东林;中文信息过滤技术的研究与应用[D];辽宁科技大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 陈长伟;刘罡;洪跃枫;;电子垃圾邮件过滤技术的应用[J];办公自动化;2004年06期
2 刘震,佘X,周明天;基于多级属性集的垃圾邮件过滤技术[J];计算机应用研究;2005年07期
3 陈治平;王雷;;基于自学习K近邻的垃圾邮件过滤算法[J];计算机应用;2005年S1期
4 李星;田莹;段海新;;中文垃圾邮件过滤系统的实现和评估[J];大连理工大学学报;2005年S1期
5 刘红翼;;一种垃圾邮件过滤器的设计与实现[J];广西科学院学报;2005年04期
6 詹川;卢显良;周旭;侯孟书;袁连海;;基于贝叶斯公式的垃圾邮件过滤方法[J];计算机科学;2005年02期
7 张强;;基于阻断发送源的垃圾邮件过滤技术[J];网络安全技术与应用;2006年02期
8 胡永杰;卜红霞;;垃圾邮件过滤技术研究[J];河北师范大学学报;2006年02期
9 王倩倩;段震;;基于神经网络的垃圾邮件过滤[J];合肥学院学报(自然科学版);2006年01期
10 袁耀文;盛励;;基于信息免疫技术的垃圾邮件过滤技术[J];计算机应用研究;2006年05期
中国重要会议论文全文数据库 前10条
1 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 潘文锋;王斌;谭松波;;贝叶斯垃圾邮件过滤研究[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
3 刘红翼;;一种垃圾邮件过滤器的设计与实现[A];广西计算机学会2005年学术年会论文集[C];2005年
4 张尼;方滨兴;;垃圾邮件过滤技术综述[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
5 张志斌;施水才;吕学强;;基于贝叶斯方法的中文垃圾邮件过滤技术综述[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年
7 张海雷;王会珍;王安慧;朱靖波;;基于朴素贝叶斯模型的垃圾邮件过滤技术比较分析[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
8 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
9 岑芳明;王明文;王鹏鸣;戴玉娟;;基于核偏最小二乘分类的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 牛明珠;;病毒和垃圾邮件过滤技术浅析[A];二○○九年全国电力企业信息化大会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 ;测试垃圾邮件过滤系统[N];网络世界;2003年
2 ;如何选择和使用UTM设备[N];网络世界;2009年
3 本报记者 朱杰;中小企业网络也能云安全[N];中国计算机报;2009年
4 本报记者 宋丽娜;整合安全平台的魅力[N];网络世界;2004年
5 宋伟;终结混合威胁攻击[N];中国计算机报;2004年
6 湖北 张湘凯;慎用Web邮箱过滤功能[N];电脑报;2002年
7 张振;CA eTrust Secure Content Manager提升运营效率[N];电脑商报;2003年
8 雷雷;如虎添翼加入UTM的3D-SMP[N];科技日报;2006年
9 记者 马霞;下一代防火墙整体性能达320G[N];科技日报;2012年
10 ;FCI过滤恶意流量[N];中国计算机报;2004年
中国博士学位论文全文数据库 前4条
1 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
2 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
3 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
4 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈俊伟;图片垃圾邮件过滤系统[D];华东师范大学;2009年
2 徐隽;基于流数据特性的垃圾邮件过滤技术研究[D];复旦大学;2009年
3 林伟;基于贝叶斯分类的垃圾邮件过滤系统研究与实现[D];西华大学;2009年
4 徐熙;基于内容的多级垃圾邮件过滤系统研究[D];西华大学;2009年
5 卢扬竹;基于内容的垃圾邮件过滤技术研究[D];西南交通大学;2009年
6 郑春光;基于免疫的垃圾邮件过滤技术研究[D];哈尔滨理工大学;2009年
7 欧德宁;垃圾邮件过滤技术研究[D];山东大学;2009年
8 王志波;基于数据挖掘的垃圾邮件过滤技术研究[D];陕西师范大学;2009年
9 王剑;惰性学习分类法在垃圾邮件过滤中的应用研究[D];上海师范大学;2009年
10 孙雪;基于内容的垃圾邮件过滤系统研究[D];河北大学;2010年
,本文编号:1189892
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1189892.html