《Proceedings of 2010 4th International Conference on Intelli
本文关键词:一种基于聚类技术的选择性神经网络集成方法,,由笔耕文化传播整理发布。
《Proceedings of 2010 4th International Conference on Intelligent Information Technology Application(Volume 4)》2010年
Bagging eEP-based classifiers for junk mail classification
【摘要】:The problem of classifying junk emails on the Internet are getting more and more attention recently.The highly skewed email datasets make it difficult to classify them correctly by using many traditional classifiers.Bagging is a method for improving the predictive power of weak classifiers,which can improve the performance of unstable classifiers.This paper uses a special kind of emerging patterns,called essential emerging pattern (eEP),to build eEP-based classifiers,and bagging them to build effective ensemble to the junk email examine,and carries out a new categorization and filtering algorithm BeEPJMC.The experiments show,the bagging methods and the combination eEP classification is a very efficient method of classification,and The classification efficiency of the algorithm BeEPJMC is higher than currently several better classification algorithm.
【分类号】:TP393.098
【正文快照】:
I. THE BASIC CONCEPTDB-based training data set contains N samples e-mail(T1, T2, ..., TN), is divided into two known types of C1,C2, and a given sample of each class mail. Classificationin the mail, all the samples are all text. Although the textof the t
下载全文更多同类文献
PDF全文下载
CAJ全文下载
(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)
CAJViewer阅读器支持CAJ、PDF文件格式,AdobeReader仅支持PDF格式
【参考文献】
中国期刊全文数据库 前3条
1 刘震;周明天;;基于有监督Bayesian网络的垃圾邮件过滤[J];计算机应用;2006年03期
2 王斌,潘文锋;基于内容的垃圾邮件过滤技术综述[J];中文信息学报;2005年05期
3 林琛;李弼程;;一种有效的垃圾邮件过滤新方法[J];计算机应用;2006年08期
【共引文献】
中国期刊全文数据库 前10条
1 李勇,王建波;分类回归树中分裂法则的相合性质[J];北京师范大学学报(自然科学版);2002年01期
2 成忠;诸爱士;陈德钊;;组合偏最小二乘回归方法在近红外光谱定量分析中的应用[J];分析化学;2007年07期
3 师凯;蔡延光;邹谷山;王涛;;分段蚁群算法在运输调度问题中的应用[J];广东工业大学学报;2006年01期
4 吴骋,贺佳,贺宪民,付旭平;cDNA微阵列实验分析中常用的统计方法[J];国外医学.生物医学工程分册;2004年05期
5 谢华;夏顺仁;张赞超;;医学图像识别中多分类器融合方法的研究进展[J];国际生物医学工程杂志;2006年03期
6 姜远,陈兆乾,周志华;一种改进的决策规则生成算法[J];广西师范大学学报(自然科学版);2003年01期
7 王宇;陈宇;;数字电路测试生成中的几种仿生优化算法[J];信息技术;2007年09期
8 李凯,黄厚宽;一种基于聚类技术的选择性神经网络集成方法[J];计算机研究与发展;2005年04期
9 姜远;周志华;;基于词频分类器集成的文本分类方法[J];计算机研究与发展;2006年10期
10 田春娜;高新波;李洁;;基于嵌入式Bootstrap的主动学习示例选择方法[J];计算机研究与发展;2006年10期
中国重要会议论文全文数据库 前10条
1 陈华杰;韦巍;;一种基于元泛化的Bagged Boosting算法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
2 师凯;蔡延光;邹谷山;王涛;;蚁群算法及粒子群算法对比及在VRP中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
3 刘峰;瞿俊;;基于聚类分析和神经网络的时间序列预测方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
4 Yang Bai Dayou Liu Chengmin Sun College of Computer Science and Technology,Jilin University,Changchun 130012,China Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun 130012,China;SOIL pH FORECAST APPLICATION SYSTEM BASED ON MODIFIED BP NEURAL NETWORK[A];Proceedings of the 3rd International Symposium on Intelligent Information Technology in Agriculture(ISIITA)[C];2005年
5 WalterD.Andrews;JosephP.Campbell;DouglasA.Reynolds;;BOOTSTRAPPING FOR SPEAKER RECOGNITION[A];The Proceedings of the 6~(th) International Conference on Spoken Language Processing (Volume Ⅱ)[C];2000年
6 陈高鹏;胡郁;王仁华;;考虑语速和前后环境的基频Target模型及实现[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 Dragomir Radev;;Combining Labeled and Unlabeled Data for Learning Cross-document Structural Relationships[A];Proceedings of the Conference First International Joint Conference on Natural Language Processing[C];2004年
8 Yufeng DENG, Jun GUO, Shoushan LUO School of Information Engineering, Beijing University of Posts and Telecommunications 10. Xi Tu Cheng Road, Haidian District, Beijing, 100876.;Some Notes on the Stability of Learning[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
9 吕强;刘士荣;俞金寿;;神经网络聚类加权集成及其应用[A];2007年中国智能自动化会议论文集[C];2007年
10 黄文良;李石坚;刘菊新;徐从富;;大规模垃圾短信实时过滤系统的设计与实现[A];中国通信学会第五届学术年会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
2 雷景生;神经网络的分类、聚类功能及其规则抽取研究[D];新疆大学;2003年
3 许廷发;GABOR小波神经网络算法及其在灰度图象目标识别中的应用研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2004年
4 徐承建;质谱数据发掘与联用色谱分析方法及其在中药分析中的应用研究[D];中南大学;2003年
5 蒋艳凰;遥感图像高精度并行监督分类技术研究[D];国防科学技术大学;2004年
6 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
7 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
8 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
9 阳爱民;模糊分类模型的研究[D];复旦大学;2005年
10 张文彤;甲型流感病毒H3抗原进化及变异规律研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 姬水旺;强噪声和类间重叠数据下支持向量机学习的研究[D];武汉科技大学;2002年
2 闫胜业;基于学习的人脸面部图像快速检测算法研究[D];北京工业大学;2003年
3 职为梅;基于eEP的两阶段方法分类[D];郑州大学;2003年
4 田玲;银行客户关系管理的数据挖掘应用研究[D];四川大学;2003年
5 乐斌;Boosting算法研究及其在光谱分析中的应用[D];浙江大学;2004年
6 吴鑫;数据挖掘技术在JSBAS系统构建和大客户分析中的应用[D];南京航空航天大学;2004年
7 沈旭昌;隐私保护的分布式数据挖掘系统[D];浙江工业大学;2004年
8 魏崴;模块化神经网络中的若干问题研究[D];武汉理工大学;2004年
9 韦艳艳;分布式数据挖掘的分类器组合问题及相关技术研究[D];广西大学;2004年
10 赵桂敏;基于综合集成的人脸识别[D];中南大学;2004年
【二级参考文献】
中国期刊全文数据库 前6条
1 落红卫,刘建毅,王枞,钟义信;智能邮件过滤系统的研究与实现[J];机电产品开发与创新;2003年01期
2 谭立球,谷士文,费耀平;个人化电子邮件自动过滤系统的设计[J];计算机应用;2002年06期
3 王庆波,方滨兴,云晓春;电子邮件过滤检测系统的设计与实现[J];计算机应用研究;2000年10期
4 刘震,佘堃,周明天;基于多级属性集的垃圾邮件过滤技术[J];计算机应用研究;2005年07期
5 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
6 李渝勤,孙丽华;基于规则的自动分类在文本分类中的应用[J];中文信息学报;2004年04期
【相似文献】
中国期刊全文数据库 前10条
1 刘青,李海峰,袁科;微阵列数据中一种改进Bagging决策树算法的研究[J];计算机工程与科学;2005年06期
2 宋星光,夏利民,赵桂敏;基于LNMF分解的人脸识别[J];计算机工程与应用;2005年05期
3 李晓梅,马树元,吴平东,陈之龙,柳回春;基于Bagging的手写体数字识别系统[J];计算机工程与科学;2004年02期
4 谷雨,郑锦辉,戴明伟,何磊;基于Bagging支持向量机集成的入侵检测研究[J];微电子学与计算机;2005年05期
5 韩俊英;刘成忠;;一种改进的支持向量机集成分类算法[J];甘肃农业大学学报;2008年01期
6 郑建军;甘仞初;贺跃;于同;;神经网络分类器动态集成方法[J];北京理工大学学报;2005年12期
7 张妤;王文剑;康向平;;一种回归SVM选择性集成方法[J];计算机科学;2008年04期
8 边吉荣;;基于CS-SVM与Bagging的垃圾邮件过滤算法研究[J];宁夏工程技术;2008年01期
9 卓丽霞;田佳;;基于C4.5算法的集成方法研究[J];重庆工学院学报;2006年11期
10 王丽丽;苏德富;;基于群体智能的选择性决策树分类器集成[J];计算机技术与发展;2006年12期
中国重要会议论文全文数据库 前10条
1 Aurangzeb Khan;Baharum B.Bahurdin;Khairullah Khan;;An Overview of E-Documents Classification[A];Proceedings of International Conference on Machine Learning and Computing(ICMLC 2009)[C];2009年
2 祝团飞;李益洲;孙婧;李梦龙;;一种构建支持向量机融合的新方法[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
3 Haytham Mohtasseb;Amr Ahmed;;More Blogging Features for Author Identification[A];Proceedings of International Conference on Computer Engineering and Applications(ICCEA 2009)[C];2009年
4 Phayung Meesad;Pudsadee Boonrawd;Vatinee Nuipian;;A Chi-Square-Test for Word Importance Differentiation in Text Classification[A];Proceedings of International Conference on Information and Electronics Engineering(ICIEE 2011)[C];2011年
5 John Murphy;Robert Steele;;Some Observations on the Nature and Computer-based Representation of Legal Documents and Their Link Data[A];Proceedings of International Conference on Machine Learning and Computing(ICMLC 2009)[C];2009年
6 ;A Binary Classification Method Based On Class Space Model[A];Proceedings 2010 International Conference on Intelligent Computing and Integrated Systems[C];2010年
7 Vahhab Attar Olyaee;;An Integrated IT Governance model: A way toward the success of the IT projects.[A];Proceedings of International Conference on Computer Communication and Management(ICCCM 2011)[C];2011年
8 ;A New Feature Selection Method Based on Distributional Information for Text Classification[A];Proceedings of the 2010 IEEE International Conference on Progress in Informatics and Computing[C];2010年
9 薛董敏;赵晖;李峰泉;;基于文化算法和负相关学习的选择性支持向量机集成[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
10 AGREIL Cyril;MEURET Michel;;Recording the prehensive bite diversity in cows for a dynamic analysis of foraging behavior on diversified vegetation[A];Proceedings of the XXI International Grassland Congress and the VIII International Rangeland Congress(volumeⅠ)[C];2008年
中国博士学位论文全文数据库 前9条
1 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
2 赵强利;基于选择性集成的在线机器学习关键技术研究[D];国防科学技术大学;2010年
3 谢元澄;分类器集成研究[D];南京理工大学;2009年
4 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年
5 顾本柏;客体相似性表征的认知和发展机制研究[D];西南大学;2011年
6 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
7 齐峰;人工神经树网络模型的优化研究与应用[D];山东师范大学;2011年
8 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
9 程丽丽;支持向量机集成学习算法研究[D];哈尔滨工程大学;2009年
中国硕士学位论文全文数据库 前10条
1 吴杰;基于Bagging的神经网络集成及其泛化能力研究[D];东北师范大学;2010年
2 侯小静;贝叶斯分类器研究及其在Web文档分类中的应用[D];郑州大学;2005年
3 谈蔚欣;基于分类器组合的交通拥堵预测[D];福州大学;2006年
4 张妤;支持向量机集成学习方法研究[D];山西大学;2008年
5 沈晓波;仿生态神经网络算法研究及其在声信号车型识别中的应用[D];东北师范大学;2008年
6 王冰玉;集成学习算法的改进及其应用[D];西安电子科技大学;2009年
7 刘艳霞;基于eEP的稀有类分类问题研究[D];郑州大学;2005年
8 马芳;机器翻译系统中英语从句的识别研究[D];解放军信息工程大学;2006年
9 刘风;基于集成学习的投影分析及其在人脸识别中的应用[D];扬州大学;2009年
10 江志钢;基于支持向量机的核电设备故障诊断方法研究[D];南华大学;2010年
本文关键词:一种基于聚类技术的选择性神经网络集成方法,由笔耕文化传播整理发布。
本文编号:150273
本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/150273.html