基于不完备决策表的属性约简及规则获取算法的研究
本文关键词:基于不完备决策表的属性约简及规则获取算法的研究
更多相关文章: 粗糙集 知识粒度 属性约简 规则获取 粒度差别矩阵
【摘要】:随着高科技的飞速发展,全世界每天都有几十亿的人在使用手机、电脑和其他电子产品,产生了大量的海量数据。大数据从互联网向其他领域急速蔓延,各行各业都已经被数据给渗透,对于海量数据的有效处理成为目前研究的热点之一。在2015年的两会期间,李总理签订了国务院有关推进“互联网+”行动的指导意见,给互联网与传统行业之间的有效结合提供了政策依据。数据挖掘的发展优势越来越突出,占据了互联网的广阔天地。所谓数据挖掘就是对数据库中的数据,利用一些数据处理的方法,查找出在信息之间存在的内在关系的过程。包含数理统计、模式识别、神经网络等技术,广泛应用于电信、航空公司、政府和科学领域中。粗糙集是数据挖掘的方法之一,是一种用于处理不准确、含有缺省值的工具。相较于模糊集,它最突出的特点是不需要其他先验的信息,或附加的知识,就可以直接处理信息,找出海量数据中的隐含知识,应用于实际生活中。在数据挖掘的过程中,属性约简可以被看做为一个预处理的步骤,同时在粗糙集理论中占据了举足轻重的地位。属性约简可以定义为在保证知识库能够有效的区别库中含有的对象的前提下,将其中不能起到决定作用的属性消去。因此,在操作之后可以有效地减少知识库中的属性表示,同样也保证了对象基本信息的完整性。在将知识库中的冗余属性消去之后,在很大程度上降低了知识所占用的空间,有效的减少了成本支出。在目前的研究进程中,将粗糙集的属性约简分成了两种不同的类型,一种是包含全部的信息,叫做完备知识表,另一种中含有不确定的或者空缺的信息,命名为不完备知识表。完备知识表指的是在知识系统中所有的对象信息都是准确并且全面的,现在对于完备知识系统的属性约简探索相对来讲是比较全面也比较成熟的,在现实的应用中也施展出来了很大的引导作用。但是,实际生活中由于数据搜集设备的不可避免的误差,或者是搜集过程中环境的影响等情况,导致知识系统中会有一些信息缺失的情况存在,原有完备知识系统的算法已经不能适用于这种情况。对含有缺失信息的决策表的研究是未来科学家和学者们重点关注的地方。此外,规则获取是粗糙集理论中的一个比较实用的领域。随着信息爆炸式的增长,企业和各种组织积累了海量的数据,但是这些数据本身并不是有用的信息,在数据中的规则才是对企业做出有效决策提供帮助的信息,可以使企业在处理数据信息时有可靠的依据。因此获取决策知识库中的规则同样具有实用性。本文对当前学者在粗糙集中属性约简和规则获取中取得的研究成果进行了学习,在结合他们的基础上,进行了以下创新:(1)在不完备知识系统中,引入了基于粒度的差别矩阵,利用条件属性在区别对象时出现频率的属性约简思想,在粒度差别矩阵的基础上,构造了计算属性频率的启发函数。以知识粒度为启发信息,提出了新的约简算法,使得算法的时空复杂度都得到了很大幅度的降低,分别降为O(K|C||U|)(其中K=max{|TC(xi)|,xi∈U}和O(|U|),最后通过数据集进行仿真实验,证明了算法相较于同类算法有较高的时间效率。(2)介绍了LEM2规则获取算法总有属性-值对是在反复的被纳入候选属性-值对,然后又在程序的后面进行反向消除的缺陷,及一系列改进算法的不足之处,本文引入广义决策函数,在程序执行之前就先删除存在的冗余属性-值对,使它们无法参与后面的一系列操作,减少了属性-值对的样本空间,提高了求取属性-值对的效率。
【关键词】:粗糙集 知识粒度 属性约简 规则获取 粒度差别矩阵
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18;TP311.13
【目录】:
- 摘要3-5
- Abstract5-9
- 1. 绪论9-15
- 1.1 选题背景和目的9-10
- 1.2 粗糙集理论相关概述10-14
- 1.2.1 粗糙集理论的产生与发展10-12
- 1.2.2 粗糙集理论的研究现状12-14
- 1.3 论文的主要创新点14
- 1.4 论文的组织与安排14-15
- 2. 粗糙集理论相关概述15-26
- 2.1 知识与分类15-17
- 2.2 决策表的基本概念17-19
- 2.2.1 完备决策表的基本概念17-18
- 2.2.2 不完备决策表的基本概念18-19
- 2.3 完备决策表属性约简及求核19-23
- 2.3.1 基于正区域模型的属性约简和核属性定义19-20
- 2.3.2 基于Skowron差别矩阵模型的属性约简和核属性定义20
- 2.3.3 基于信息熵的约简及求核定义20-21
- 2.3.4 知识粒度的属性约简定义21
- 2.3.5 基于分布、最大分布和分配的约简定义21-23
- 2.4 在不完备决策系统中的属性约简及核定义23-25
- 2.4.1 在正区域上的属性约简与求核定义23
- 2.4.2 差别矩阵的属性约简及求核23-24
- 2.4.3 在知识粒度上的约简及求核定义24
- 2.4.4 广义决策的约简定义24-25
- 2.5 本章小结25-26
- 3. 基于知识粒度的快速属性约简算法26-37
- 3.0 设计思想26
- 3.1 基本定义及性质26-27
- 3.2 粒度差别矩阵相关概念27-30
- 3.3 构造启发函数30-31
- 3.4 属性约简算法31-32
- 3.5 实例分析32-34
- 3.6 仿真实验对比34-36
- 3.7 本章小结36-37
- 4. 基于快速缩小样本空间的改进的LEM2算法37-47
- 4.1 设计思想37
- 4.2 相关概念37-39
- 4.3 LEM2及其改进算法的局限性分析39-41
- 4.4 快速缩小样本空间的改进算法41-43
- 4.5 实验分析43-45
- 4.6 小结45-47
- 5. 展望47-49
- 5.1 论文总结与不足47-48
- 5.2 展望48-49
- 参考文献49-53
- 攻读硕士学位期间科研成果53-54
- 致谢54-55
【相似文献】
中国期刊全文数据库 前10条
1 王燕;李明;;基于扩展概念格的分类规则获取算法[J];计算机应用;2007年10期
2 王珏,刘三阳,张杰,刘振华;基于粗集的模糊信息系统有序规则获取[J];系统工程与电子技术;2004年06期
3 程玉胜;张佑生;胡学钢;章晓良;;基于任意分割的串行进位链规则获取的计算流程[J];电子学报;2009年12期
4 安利平,仝凌云;粗集理论中基于规则及其参数的分类识别[J];计算机工程与应用;2004年03期
5 张清华;王国胤;刘显全;;基于最大粒的规则获取算法[J];模式识别与人工智能;2012年03期
6 王丽娟;杨习贝;杨静宇;吴陈;;基于多粒度理论的不完备决策规则获取[J];南京理工大学学报;2013年01期
7 代建华,潘云鹤;一种基于分类一致性的决策规则获取算法[J];控制与决策;2004年10期
8 旷海兰;刘新华;罗可;;一种改进的规则获取方法[J];微计算机信息;2006年18期
9 马志锋,邢汉承,郑晓妹;粗糙控制中的规则获取策略研究[J];工业仪表与自动化装置;2000年06期
10 郑旭玲;周昌乐;李堂秋;陈毅东;;基于关联规则挖掘的汉语语义搭配规则获取方法[J];厦门大学学报(自然科学版);2007年03期
中国重要会议论文全文数据库 前2条
1 王红军;张建民;徐小力;;粗糙集规则获取在旋转注水机组故障诊断中的应用[A];设备监测与诊断技术及其应用——第十二届全国设备监测与诊断学术会议论文集[C];2005年
2 吕韶义;刘复岩;;基于决策树的规则获取[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
中国博士学位论文全文数据库 前1条
1 程玉胜;基于粗糙集理论的知识不确定性度量与规则获取方法研究[D];合肥工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 李士飞;“承认规则”理论探析[D];重庆大学;2015年
2 王磊;当代中国社会潜规则的哲学解读[D];延安大学;2015年
3 易成非;论中国潜规则与明规则的合谋与共生[D];天津大学;2014年
4 孙胜杰;基于样本数据的模糊规则提取方法研究及其应用[D];中国科学技术大学;2016年
5 乔丽娟;基于不完备决策表的属性约简及规则获取算法的研究[D];广西师范大学;2016年
6 谭志雄;潜规则的反思与超越[D];华侨大学;2014年
7 彭鄢;法治视野下潜规则治理对策研究[D];重庆大学;2014年
8 金丽;中国公共权力潜规则产生原因分析[D];华东师范大学;2010年
9 王丽丽;不完备系统中混合数据关联规则挖掘的研究[D];长沙理工大学;2008年
10 王金燕;基于关联规则的告警相关性分析及在数据网管系统中的应用[D];西安电子科技大学;2006年
,本文编号:690979
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/690979.html