粗等价类双边递减下多次Hash的渐增式求核与约简算法
本文选题:粗糙约简 + 核 ; 参考:《系统工程理论与实践》2017年02期
【摘要】:为设计高效约简算法,首先以全局等价类为最小计算单位提出粗等价类概念,证明粗等价类下约简与原信息系统等价;然后深入剖析1,0,-1三类粗等价类的性质,把求正区域等价转化为0-粗等价类双边递减下的渐增式计算,结合1和-1-粗等价类的传递性,设计双边横向删减实体和纵向删减属性的优化规则,可在每一轮增量计算中缩减计算域,基于此设计多次Hash的属性增量划分方法;最后给出新的渐增式快速求核与约简算法,其中求核基于纵向优化规则,可在一次计算中求得多个非核属性,无需遍历全部属性.基于UCI、海量和超高维3类数据集进行多个实验,实验结果证明本文求核与约简算法是高效完备的,在海量数据与超高维数据集下有较大优势.
[Abstract]:In order to design an efficient reduction algorithm, the concept of rough equivalence class is first put forward with the global equivalence class as the minimum unit of calculation, and it is proved that the reduction under the rough equivalence class is equivalent to the original information system. In this paper, the equivalence of positive region is transformed into the incremental calculation under the condition of bilateral decline of 0-rough equivalence class. Combining with the transitivity of 1 and -1-rough equivalence classes, the optimization rules for the horizontal and vertical deletion properties of the two sides are designed. In each round of incremental computation, the computing domain can be reduced and the attribute increment partition method of Hash can be designed several times. Finally, a new incremental fast kernel-finding and reduction algorithm is presented, in which the kernel is based on longitudinal optimization rules. Multiple non-core attributes can be obtained in one calculation without traversing all of them. Based on UCI, three kinds of data sets, massive and ultra-high dimensional, are experimented. The experimental results show that the kernel and reduction algorithms are efficient and complete, and have a great advantage in massive data and ultra-high dimensional data sets.
【作者单位】: 广东工业大学管理学院管科系;中国科学院信息工程研究所;
【基金】:国家自然科学基金(71401045,71571052) 广东省自然科学基金(2016A030310300)~~
【分类号】:TP18
【相似文献】
相关期刊论文 前10条
1 李宏博;李占山;韩文成;;基于等价类划分的配置求解与解释计算[J];软件学报;2011年05期
2 农修德;徐章艳;阮慎;杨炳儒;;新的等价类划分算法—计数法[J];计算机工程与应用;2009年02期
3 金一庆,张敏霞;快速等价类划分在大型课程调度中的应用[J];浙江大学学报(自然科学版);1998年02期
4 琚春华;梅铮;刘东升;;一种基于粗糙等价类的商业数据预处理方法[J];小型微型计算机系统;2009年05期
5 王琳;闫德勤;梁宏霞;;结合概率和等价类的双系数支持向量机[J];计算机应用;2009年12期
6 程克非;张聪;沈一栋;;计算机桥牌双明手解的Hash表改进[J];重庆大学学报(自然科学版);2005年12期
7 刘震宇,郭宝龙,杨林耀;一种新的用于连续值属性离散化的约简算法[J];控制与决策;2002年05期
8 李鸿;一种基于粗糙熵的知识约简算法[J];计算机工程与应用;2005年14期
9 聂秀珍;;关于粒度熵的知识约简算法[J];无线互联科技;2013年11期
10 李鸿;基于条件粗糙熵的知识相对约简算法[J];宿州学院学报;2005年01期
相关会议论文 前3条
1 李然;吕永江;林和;李永礼;;基于数据库系统的知识约简算法[A];2005全国自动化新技术学术交流会论文集(三)[C];2005年
2 孙茂圣;李斌;;一种分布式本体融合及冗语关系约简算法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
3 樊艳英;徐章艳;张伟;张自敏;陈冠萍;;一种基于粗糙集理论的完备值约简算法[A];广西计算机学会2012年学术年会论文集[C];2012年
相关硕士学位论文 前5条
1 刘素军;基于GA-PSO的粗糙集属性的简算法的研究[D];华中师范大学;2015年
2 李然;粒计算的高效知识约简算法与缺失数据处理[D];兰州大学;2006年
3 安爽;基于信息熵的数据约简算法[D];东北大学;2008年
4 闫电勋;粗糙集并行约简算法研究[D];浙江师范大学;2012年
5 梁泉;复杂系统预测中知识约简算法及其表示的研究[D];中南林学院;2004年
,本文编号:1833200
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1833200.html