一种处理部分标记数据的粗糙集属性约简算法
本文选题:粗糙集 切入点:增量式属性约简 出处:《计算机科学》2017年01期
【摘要】:属性约简是粗糙集理论中重要的研究内容之一,是数据挖掘中知识获取的关键步骤。Pawlak粗糙集约简的对象一般是有标记的决策表或者是无标记的信息表。而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据。为此,结合半监督协同学习理论,提出了处理半监督数据的属性约简算法。该算法首先在有标记数据上构造两个差异性较大的约简来构造基分类器;然后在无标记数据上交互协同学习,扩大有标记数据集,获得质量更好的约简,构造性能更好的分类器,该过程迭代进行,从而实现利用无标记数据提高有标记数据的约简质量,最终获得质量较好的属性约简。UCI数据集上的实验分析表明,该算法是有效且可行的。
[Abstract]:Attribute reduction is one of the important research contents in rough set theory, the object is a key step of knowledge acquisition in the.Pawlak data mining rough set reduction decision table is generally marked or unmarked information table. But in many practical problems have very limited labeled data, is more unlabeled data, namely half supervision data. Therefore, combining semi supervised cooperative learning theory, put forward the attribute reduction algorithm of semi supervised data. The algorithm firstly in the labeled data to construct the base classifier to construct two different reduction; then in the unlabeled data on the interaction of collaborative learning, expand the labeled data set, obtained reduction quality better, build better classifier, the iterative process, so as to realize the advantage of unlabeled data to improve the quality of a reduction of labeled data, and eventually obtain a better quality attribute reduction.UCI The experimental analysis on the data set shows that the algorithm is effective and feasible.
【作者单位】: 同济大学电子与信息工程学院计算机科学与技术系;上海电力学院计算机科学与技术学院;同济大学嵌入式系统与服务计算教育部重点实验室;深圳大学计算机与软件学院;香港理工大学应用科学与纺织学院;
【基金】:国家自然科学基金项目(61273304) 2013年度高等学校博士学科点专项科研基金(20130072130004)资助
【分类号】:TP18
【相似文献】
相关期刊论文 前10条
1 罗进;周学君;;半监督学习中非标记数据的利用[J];湖北大学学报(自然科学版);2008年01期
2 郭涛;李贵洋;兰霞;;基于图的半监督协同训练算法[J];计算机工程;2012年13期
3 李艳娟;郭茂祖;;关系tri-training:利用无标记数据学习一阶规则[J];计算机科学与探索;2012年05期
4 李昆仑;曹铮;曹丽苹;张超;刘明;;半监督聚类的若干新进展[J];模式识别与人工智能;2009年05期
5 武永成;;无标记数据学习及其在图像检索中的应用[J];软件导刊;2013年03期
6 邓超;郭茂祖;;基于Tri-Training和数据剪辑的半监督聚类算法[J];软件学报;2008年03期
7 李昆仑;张伟;代运娜;;基于Tri-training的半监督SVM[J];计算机工程与应用;2009年22期
8 易淼;刘小兰;;基于相对变换的半监督分类算法[J];计算机应用;2011年10期
9 苏进胜;谢彦峰;张忠林;;基于事务的概率标记数据包的IP回溯[J];兰州交通大学学报;2006年04期
10 高云天;;基于不完全信息的半监督KMeans算法[J];中国新技术新产品;2009年03期
相关会议论文 前1条
1 刘小平;黎夏;张啸虎;;一种新的基于多标记分解模型的遥感软分类方法[A];中国地理学会百年庆典学术论文摘要集[C];2009年
相关博士学位论文 前1条
1 覃姜维;迁移学习方法研究及其在跨领域数据分类中的应用[D];华南理工大学;2011年
相关硕士学位论文 前7条
1 刘萌;基于特征的归纳式迁移学习方法研究[D];哈尔滨工程大学;2012年
2 卢小燕;基于半监督和局部降维的多标记数据分类[D];中南大学;2013年
3 郭跃健;多值属性和多标记数据分类[D];中南大学;2010年
4 张顺;多标记数据分类相关技术研究[D];山东师范大学;2013年
5 丁涛;半监督自训练分类模型的研究与实现[D];大连理工大学;2009年
6 付华;基于极限学习机的半监督分类[D];西安电子科技大学;2013年
7 张金辉;基于少量标记数据约束聚类算法的入侵检测技术研究[D];南京航空航天大学;2009年
,本文编号:1716533
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1716533.html