一种基于信息增益的新垃圾邮件特征选择算法
本文选题:信息增益 + 类内分散度 ; 参考:《吉林大学学报(理学版)》2017年02期
【摘要】:基于传统信息增益特征选择算法,通过提出类内分散度与类间集中度的概念,结合传统信息增益算法,解决了信息增益算法因忽略特征项的分布而导致的性能下降问题,提高了信息增益算法的效率.使用改进的特征选择算法进行垃圾邮件过滤实验,在不同的分类器下,与传统的特征选择算法进行对比,实验结果表明,改进的特征选择算法性能较优.
[Abstract]:Based on the traditional information gain feature selection algorithm, by proposing the concepts of intra-class dispersion and inter-class concentration, and combining the traditional information gain algorithm, the information gain algorithm solves the performance degradation problem caused by ignoring the distribution of the feature term in the information gain algorithm. The efficiency of the information gain algorithm is improved. The improved feature selection algorithm is used in spam filtering experiment, and compared with the traditional feature selection algorithm under different classifiers. The experimental results show that the improved feature selection algorithm has better performance.
【作者单位】: 吉林大学计算机科学与技术学院;
【基金】:国家自然科学基金(批准号:61471181) 吉林省自然科学基金(批准号:20140101194JC;20150101056JC)
【分类号】:TP393.098
【相似文献】
相关期刊论文 前10条
1 董立岩;李真;周灵艳;;特定信息增益决策森林分类器研究[J];计算机工程与应用;2010年26期
2 孙挺;耿国华;周明全;;基于词出现和信息增益的连续属性离散化方法[J];计算机应用研究;2009年02期
3 熊平;朱天清;顾霄;;基于信息增益比例约束的数据匿名方法及其评估机制[J];计算机应用研究;2014年03期
4 王卫平;王旭哠;陈赫然;陈家耀;;基于信息增益的防火墙过滤域排序优化[J];计算机系统应用;2009年07期
5 张小康;帅建梅;史林;;基于加权信息增益的恶意代码检测方法[J];计算机工程;2010年06期
6 苑春燕;李爱华;;基于信息增益和相关性的贝叶斯分类算法研究[J];网络与信息;2010年02期
7 刘庆和;梁正友;;一种基于信息增益的特征优化选择方法[J];计算机工程与应用;2011年12期
8 杨敬妹;王学军;;文本分类中信息增益算法的改进[J];计算机时代;2013年09期
9 潘若愚,韩晓峰;一种基于信息增益的产品评价系统模型[J];合肥工业大学学报(自然科学版);2003年S1期
10 陶剑文;赵杰煜;姚奇富;;信息增益区分频繁模式分类方法[J];计算机工程与应用;2009年07期
相关会议论文 前3条
1 刘惠;邱天爽;;基于模糊集理论和信息增益分析技术的分类算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
2 刘鹏;雷蕾;张雪凤;;缺失数据处理方法的比较研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 王孟;白清源;谢丽聪;谢伙生;张莹;;基于信息增益规则排序的关联文本分类[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
相关硕士学位论文 前6条
1 孙思莹;网络视频环境中面向用户QoE的分析与应用[D];南京邮电大学;2016年
2 毛临川;信息增益在数据挖掘分类方法中的应用研究[D];江西师范大学;2016年
3 黄冬丽;基于信息增益的基因互作挖掘方法研究[D];哈尔滨工业大学;2014年
4 刘一正;基于信息增益的互联网二元关系抽取[D];华东师范大学;2014年
5 周志凯;免疫入侵检测中基于信息增益的检测器生成研究[D];哈尔滨理工大学;2014年
6 黄杨潮;miRNA前体与成熟体预测方法的设计与实现[D];哈尔滨工业大学;2011年
,本文编号:1854588
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1854588.html