基于粗糙集成学习的半监督属性约简
本文选题:属性约简 + 粗糙集 ; 参考:《小型微型计算机系统》2016年12期
【摘要】:属性约简是粗糙集理论重要研究内容之一.Pawlak粗糙集约简的对象一般是有监督数据或者是无监督数据.而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据.仅利用有标记数据一般难以计算出质量较好的属性约简.为此,基于粗糙集理论,结合集成学习与半监督学习,提出有效地利用无标记数据计算半监督数据属性约简算法.该算法在有标记数据上构造一组差异性较大的属性约简构造集成基分类器,在半监督自训练学习过程中,用集成分类器对无标记数据做出预测,扩大有标记数据集,从而获得质量更好的约简.UCI数据集实验分析表明该算法是有效可行的.
[Abstract]:Attribute reduction is one of the important research contents in rough set theory. The objects of Pawlak rough set reduction are generally supervised data or unsupervised data. In many practical problems, there are very limited labeled data, more is unlabeled data, that is, semi-supervised data. It is difficult to calculate attribute reduction with good quality only by using marked data. Based on rough set theory and integrated learning and semi-supervised learning, an effective attribute reduction algorithm for semi-supervised data is proposed by using unmarked data. In this algorithm, a group of attribute reduction on marked data is constructed to construct an ensemble base classifier. In the process of semi-supervised self-training and learning, an integrated classifier is used to predict the unmarked data and to expand the labeled data set. The experimental results of better quality reduction. UCI dataset show that the algorithm is effective and feasible.
【作者单位】: 同济大学电子与信息工程学院计算机科学与技术系;上海电力学院计算机科学与技术学院;同济大学嵌入式系统与服务计算教育部重点实验室;深圳大学计算机与软件学院;香港理工大学应用科学与纺织学院;
【基金】:国家自然科学基金项目(61273304)资助 2013年度高等学校博士学科点专项科研基金项目(20130072130004)资助
【分类号】:TP18
【相似文献】
相关期刊论文 前10条
1 袁汉宁;;双层多示例集成学习[J];武汉理工大学学报(信息与管理工程版);2011年05期
2 俞扬;周志华;;集成学习中完全随机学习策略研究[J];计算机工程;2006年17期
3 张沧生;崔丽娟;杨刚;倪志宏;;集成学习算法的比较研究[J];河北大学学报(自然科学版);2007年05期
4 陈凯;;基于聚类技术的集成学习差异性研究[J];南京工业职业技术学院学报;2008年04期
5 李凯;崔丽娟;;集成学习算法的差异性及性能比较[J];计算机工程;2008年06期
6 潘志松;燕继坤;;少数类的集成学习[J];南京航空航天大学学报;2009年04期
7 陈凯;马景义;;一种选择性SER-BagBoosting Trees集成学习研究[J];计算机科学;2009年09期
8 陈全;赵文辉;李洁;江雨燕;;选择性集成学习算法的研究[J];计算机技术与发展;2010年02期
9 张燕平;曹振田;赵姝;郑尧军;杜玲;窦蓉蓉;;一种新的决策树选择性集成学习方法[J];计算机工程与应用;2010年17期
10 饶峰;;核机器集成学习算法的误差分析[J];重庆文理学院学报(自然科学版);2010年04期
相关会议论文 前3条
1 关菁华;刘大有;贾海洋;;自适应多分类器集成学习算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 李烨;蔡云泽;许晓鸣;;基于支持向量机集成的故障诊断[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
相关博士学位论文 前10条
1 王永明;集成回归问题若干关键技术研究[D];华东师范大学;2015年
2 常征;基于混合集成学习的眼部与四肢交互动作建模与识别[D];北京科技大学;2016年
3 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年
4 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
5 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
6 王清;集成学习中若干关键问题的研究[D];复旦大学;2011年
7 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年
8 侯勇;特征提取与集成学习算法的研究及应用[D];北京科技大学;2015年
9 李烨;基于支持向量机的集成学习研究[D];上海交通大学;2007年
10 程丽丽;支持向量机集成学习算法研究[D];哈尔滨工程大学;2009年
相关硕士学位论文 前10条
1 王希玲;基于选择性集成学习的网络入侵检测方法研究[D];青岛科技大学;2016年
2 张妤;支持向量机集成学习方法研究[D];山西大学;2008年
3 李涛;基于条件互信息的集成学习的研究与应用[D];中国海洋大学;2009年
4 杨长盛;基于成对差异性度量的选择性集成学习方法研究[D];安徽大学;2010年
5 曹振田;基于Q统计量的选择性集成学习研究[D];安徽大学;2010年
6 王丽丽;集成学习算法研究[D];广西大学;2006年
7 马冉冉;集成学习算法研究[D];山东科技大学;2010年
8 张新东;集成学习及其应用研究[D];石家庄经济学院;2010年
9 吴科主;基于多任务的多层次选择性集成学习的研究[D];安徽工业大学;2010年
10 李平;集成学习中差异性控制方法研究[D];大连海事大学;2012年
,本文编号:1959581
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1959581.html