测试代价敏感粗糙集中属性约简算法的研究
本文关键词:测试代价敏感粗糙集中属性约简算法的研究 出处:《广西师范大学》2016年硕士论文 论文类型:学位论文
更多相关文章: 粗糙集 代价敏感学习 属性约简 不完备决策表 测试代价敏感
【摘要】:粗糙集是一种刻画不完整和不确定性问题的数学工具,其不需要任何先验知识对数据进行分析和处理。面对如今高速的信息时代中海量数据的形成,粗糙集在分析处理数据中发挥了重要的作用。属性约简作为粗糙集理论研究的重要内容之一,其核心思想就是保证知识库的分类能力不变的前提下,删除冗余、错误或者不需要的知识。而代价敏感学习是目前机器学习、数据挖掘等领域研究热点之一,代价包括测试代价、误分类代价、计算代价和获取样本的代价等,其目的是以最小代价为目标建立分类器。将代价敏感学习引入粗糙集理论中的属性约简问题值得深入研究,目前将误分类代价引入粗糙集理论中的相关研究取得了不错的研究的成果,而测试代价敏感粗糙集理论的相关研究近几年才开始发展。本文主要研究测试代价敏感粗糙集中属性约简问题,分别以完备决策表和不完备决策表作为研究对象,主要的研究工作有以下几个方面。(1)为了解决测试代价敏感属性约简的高效性和准确性问题,提出一种基于免疫量子粒子群优化的最小测试代价属性约简算法。依据条件信息熵和测试代价因素定义适当的适应值函数,将最小测试代价属性约简问题转化为0-1组合优化问题,提出最小属性的属性约简问题是一种具有特殊测试代价的最小测试代价属性约简问题。最后结合量子粒子群和人工免疫方法给出约简算法,实验分别对比已有的最小属性约简算法和测试代价敏感属性约简算法,实验结果表明该算法是有效可行的。(2)在不完备决策表中,给出高效的计算容差类算法。提出不一致对象概念,研究不一致对象的性质,根据其性质给出在不一致对象下的核属性和属性约简的定义并设计求核属性算法。提出一个新的属性重要性定义,最后依据新的属性重要性定义设计一个最坏情况下时间复杂度和空间复杂度分别为O(k|C|2|U|)和O(|U|)的启发式属性约简算法,其中k为条件属性中缺省对象所产生的容差类最大的个数。算法过程只需逐步要求容差类的基数,大大减少了算法的计算过程。最后通过理论分析、实例分析和实验分析说明该算法是高效和可行性的属性约简算法,并且该算法同时适用于不一致不完备决策表和一致不完备决策表,给不完备决策表属性约简算法提供了新的方法。(3)提出不完备决策表测试代价敏感属性约简问题,给出不一致对象集定义以及求解不一致对象集的算法。根据不一致对象的性质改进属性重要性定义,考虑测试代价因素以及不一致对象个数的改变量给出一个新的属性重要性的定义和属性重要性中权重的设置方法,并给出属性重要性的计算算法。在此基础上,给出一个时间复杂度O(k|C|2|U|)和空间复杂度为O(|U|)启发式属性约简算法,其中k为条件属性中缺省对象所产生的容差类最大的个数,并通过理论分析、实例分析和实验分析说明该算法准确性和可行性。
[Abstract]:Rough set is a characterization of incomplete and uncertain problems of the mathematical tools, does not require any prior knowledge to analyze and process the data in the information age. The formation of massive data high speed today, played an important role in the data analysis of attribute reduction in rough set. As one of the important content of theoretical research rough set, its core idea is the guarantee to delete the redundant unchanged classification capacity of the knowledge base under the wrong, or do not need knowledge. And cost sensitive learning is one of the machine learning, data mining and other research hot areas, including the cost of the test cost, misclassification cost, computation cost and obtain the sample cost. Its purpose is to establish minimum cost as target classifier. Cost sensitive learning into the attribute reduction problem in the theory of rough set is worthy of further study, the misclassification cost The introduction of rough set theory in related research has achieved good results, and the test cost sensitive rough set theory research in recent years began to develop. This paper mainly studies the test cost sensitive rough set attribute reduction problem, respectively, to complete decision table and incomplete decision table as the research object, the main research work there are the following aspects. (1) in order to solve the problem of high efficiency and accuracy of the test cost sensitive attribute reduction, this paper proposes a minimal test cost immune algorithm of attribute reduction based on quantum particle swarm optimization. Based on the conditional information entropy and test cost factors defining appropriate fitness function, the minimum test cost attribute reduction into 0-1 a combinatorial optimization problem, the minimum attribute reduction attribute is a kind of special test cost minimum test cost. Finally, node attribute reduction problem Quantum particle swarm optimization and artificial immune method reduction algorithm, minimum attribute reduction algorithm and test cost sensitive attribute reduction algorithm were compared with existing experiments, experimental results show that this algorithm is effective and feasible. (2) in incomplete decision table, calculating the tolerance class algorithm is given. The inconsistent objects, concepts, research inconsistent with the nature of the object, according to its nature are defined in the inconsistent objects under the core attributes and attribute reduction and design for core attribute algorithm. Proposed a new definition of attribute importance, according to a new attribute to the definition of design a worst-case time complexity and space complexity respectively. O (k|C|2|U|) and O (|U|) heuristic attribute reduction algorithm, which produced by K as the default object condition attribute in the largest number of tolerance class. The algorithm only needs gradually tolerance class base, Greatly reduce the process of the algorithm. Finally, through theoretical analysis, case analysis and experimental analysis shows that this algorithm is feasible and efficient attribute reduction algorithm, and the algorithm is also applicable to inconsistent incomplete decision table and consistent incomplete decision table, for incomplete decision table attribute reduction algorithm provides a new method. (3) the incomplete decision table test cost sensitive attribute reduction problem, given inconsistent object set definition and solving inconsistent object set algorithm. According to the nature of inconsistent objects improved attribute importance is defined, considering the test cost and the method to set weight change given inconsistent object number of a new attribute the definition and importance of attribute importance in the calculation, and algorithm is given to the importance of attributes. On this basis, give a time complexity of O (k|C|2|U|) and the space complexity is O (|U|) heuristic attribute reduction algorithm, where k is the largest number of tolerance classes generated by default objects in conditional attributes. Theoretical analysis, case analysis and experimental analysis show that the algorithm is accurate and feasible.
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18
【相似文献】
相关期刊论文 前10条
1 张岩;;针对不完备系统的粗糙熵属性约简算法的改进[J];莆田学院学报;2006年05期
2 吴子特;叶东毅;;一种可伸缩的快速属性约简算法[J];模式识别与人工智能;2009年02期
3 薛胜军;郭强;;一种改进的最小属性约简算法[J];武汉理工大学学报(交通科学与工程版);2012年03期
4 陈鑫影;黄明;李瑞;;基于评价指数的属性约简算法[J];大连铁道学院学报;2006年02期
5 刘敏;段富;刘超慧;;基于最小集合覆盖的属性约简算法[J];电脑开发与应用;2008年08期
6 秦海鸥;汤克明;;一种保持最小广义汉明距的属性约简算法[J];武汉理工大学学报;2009年18期
7 赵洁;肖南峰;;一种基于知识颗粒的高效完备属性约简算法[J];中南大学学报(自然科学版);2009年06期
8 李秀红;史开泉;;一种基于知识粒度的属性约简算法[J];计算机应用;2006年S1期
9 徐章艳;杨炳儒;宋威;;基于区分对象对集的高效属性约简算法[J];模式识别与人工智能;2006年05期
10 龚安;牛秋丽;赵小川;周兆华;;基于属性加权频率算子的属性约简算法[J];广西师范大学学报(自然科学版);2007年04期
相关会议论文 前9条
1 李菊;刘晓平;;基于改进的差异比较表的属性约简算法[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
2 李菊;王军;王兴;;基于改进的二进制辨识矩阵的属性约简算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
3 杨思春;王建颖;陈家骏;;一种新的概念格属性约简算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 武志峰;吉根林;;一种基于决策矩阵的属性约简算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 蔡智;岳丽华;王熙法;;一种数据属性约简算法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 周创德;田卫东;周红鹃;钱宏亮;;基于阈值约束的粗糙集属性约简算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 杨善林;刘业政;马溪骏;;基于β-δ_0粗糙集模型的属性约简算法[A];2003年中国管理科学学术会议论文集[C];2003年
8 张铮;喻道远;;一种启发式属性约简算法及其扩展应用[A];2007'仪表,,自动化及先进集成技术大会论文集(一)[C];2007年
9 张铮;苏旭武;张道德;陈学锋;;装载机故障诊断属性约简算法[A];湖北省机械工程学会青年分会2006年年会暨第2届机械学院院长(系主任)会议论文集(下)[C];2006年
相关博士学位论文 前2条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 魏巍;粗糙数据分析模型与算法研究[D];山西大学;2012年
相关硕士学位论文 前10条
1 李萍;基于三支决策的海量数据分类方法研究及其在视频异常检测中的应用[D];南京大学;2016年
2 谢小军;测试代价敏感粗糙集中属性约简算法的研究[D];广西师范大学;2016年
3 张海云;信息系统中属性约简算法研究[D];山西大学;2007年
4 许烨;模糊粗糙集属性约简算法在电力营销分析中的研究[D];华北电力大学;2013年
5 姜玉苹;粗糙集属性约简算法设计与实现[D];电子科技大学;2011年
6 黄丽宇;基于压缩树技术的属性约简算法研究[D];广西师范大学;2010年
7 梁蒙;基于粗糙集的属性约简算法研究[D];河南大学;2011年
8 乔子芮;基于粒计算的属性约简算法及应用研究[D];陕西师范大学;2011年
9 姜丽言;属性约简算法在田径伤病预警中的应用研究[D];山东体育学院;2012年
10 曾强生;概念格属性约简算法研究[D];西安电子科技大学;2011年
本文编号:1384798
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1384798.html