基于模糊规则的知识发现与表示研究
本文选题:模糊规则 切入点:模糊决策树 出处:《大连理工大学》2015年博士论文 论文类型:学位论文
【摘要】:在当今数字化革命的信息时代,从数据中发现知识变得越来越重要。知识表示和推理一直被认为是知识工程的核心问题。基于模糊规则的系统作为一种重要的知识发现技术可以有效地解决知识表示和推理问题,其通过模糊规则表示知识并采用模糊逻辑推理运用知识。基于模糊规则的系统可以有效地完成各种各样的知识发现与运用任务,包括回归、聚类、分类、预测等。并且基于模糊规则的系统具有很多优势,其中包括较高的精度和具有易于理解的语义解释。本文研究了基于模糊规则的系统,包括模糊决策树、基于模糊规则的聚类和数据粒化。主要内容包括:1.提出了一种新的基于模糊规则的决策树——模糊规则决策树(FRDT)。应用模糊一致性设计了关联规则提取算法(AREA),通过关联规则提取算法AREA构建了模糊规则决策树。传统的决策树在每个节点处仅考虑一个特征,所提出的模糊规则决策树在每个节点上考虑一个由若干个特征组成的模糊规则,进而构造了高纯度的叶子节点并减小了树的规模。模糊规则决策树克服了以超平面作为决策函数的斜决策树没有语义解释的问题。应用UCI机器学习标准数据库的数据进行了实验研究,分析了模糊规则决策树的性能。与传统决策树(C4.5, LADtree, BFTree, SimpleCart, NBTree)进行了对比,所进行的统计假设检验说明了模糊规则决策树在准确率和树的规模上均优于传统决策树。2.在公理模糊集理论框架下,提出了一种新的聚类方法——AFS模糊聚类。首先,对于每个不同的样本选取模糊语义集合。其次,运用公理模糊集理论,根据所选取的模糊语义构造复杂概念作为每个样本的模糊描述。最后,将相同的或者相似的样本描述放入同一类中,形成该类的模糊描述,并且根据类描述实现对样本数据的聚类。通过UCI机器学习标准数据库的数据检验了AFS模糊聚类算法的可解释性,并且在聚类精度上可以同其他基于规则的聚类算法以及经典聚类算法FCM和K-means相比较。3.提出了一种快速数据粒化方法(FRCGC),对每个得到的信息粒给出了语义解释。首先,应用提出的无监督特征选择方法选择属性。接下来,构建模糊规则对样本进行描述,并且根据样本描述的重要程度,将典范描述挑选出来。最后,通过典范描述实现数据的粒化。可以根据实际问题,调整样本描述的定义,使得易于对该粒化方法进行改进,以处理复杂问题。通过UCI机器学习标准数据库的数据验证了所提出的数据粒化方法的可解释性和有效性。
[Abstract]:In the information age of the digital revolution, Finding knowledge from data has become more and more important. Knowledge representation and reasoning have always been considered as the core of knowledge engineering. As an important knowledge discovery technology, fuzzy rule based system can effectively solve knowledge. Representation and reasoning problems, The system based on fuzzy rules can effectively accomplish all kinds of tasks of knowledge discovery and application, including regression, clustering and classification. Moreover, the system based on fuzzy rules has many advantages, including high precision and easy to understand semantic interpretation. This paper studies the system based on fuzzy rules, including fuzzy decision tree, Clustering and data granulation based on fuzzy rules. The main contents include: 1. A new decision tree based on fuzzy rules, fuzzy rule decision tree (FRDTT), is proposed. The association rule extraction algorithm is designed by using fuzzy consistency. The rule extraction algorithm AREA constructs a fuzzy rule decision tree. The traditional decision tree considers only one feature at each node. The proposed fuzzy rule decision tree considers a fuzzy rule composed of several features on each node. The fuzzy rule decision tree overcomes the problem that the oblique decision tree with hyperplane as the decision function has no semantic interpretation. Using UCI machine learning standard database. The data were studied experimentally. The performance of fuzzy rule decision tree is analyzed and compared with traditional decision tree C4.5, LADtree, BFTreeSimpleCart, NBTree. The statistical hypothesis test shows that the fuzzy rule decision tree is superior to the traditional decision tree in accuracy and tree scale. A new clustering method, AFS fuzzy clustering, is proposed under the framework of axiomatic fuzzy set theory. For each sample, fuzzy semantic set is selected. Secondly, using axiomatic fuzzy set theory, complex concepts are constructed according to the selected fuzzy semantics as the fuzzy description of each sample. Finally, Put the same or similar sample descriptions into the same class to form a fuzzy description of the class, And the clustering of sample data is realized according to class description. The interpretability of AFS fuzzy clustering algorithm is tested by the data of UCI machine learning standard database. And the clustering accuracy can be compared with other rule-based clustering algorithms and classical clustering algorithms FCM and K-means. 3. A fast data granulation method is proposed. The proposed unsupervised feature selection method is applied to select attributes. Next, fuzzy rules are constructed to describe the sample, and the canonical description is selected according to the importance of the sample description. Finally, Granulation of data can be realized by canonical description. The definition of sample description can be adjusted according to practical problems, which makes it easy to improve the granulation method. In order to deal with complex problems, the interpretability and validity of the proposed data granulation method are verified by the data of UCI machine learning standard database.
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:O159;TP311.13
【相似文献】
相关期刊论文 前10条
1 王玲;基于知识发现的生物信息学[J];生物工程进展;2000年03期
2 刘兵;知识发现与数据开采(英文)[J];世界科技研究与发展;1997年06期
3 欧阳为民,郑诚;一种改进的基于属性归约的知识发现方法[J];安徽大学学报(自然科学版);2000年03期
4 柴毅,黄席樾,李佳,涂运华,何离庆;基于数据统计分析的知识发现[J];高技术通讯;2001年11期
5 王军勤;罗雁;;医学中的信号、信息和知识[J];中国科技信息;2010年03期
6 陀向明;;图书馆知识发现系统应用状况分析[J];科技情报开发与经济;2013年16期
7 卢昌荆,史开泉,薛永生;知识过滤和它的依赖推理发现[J];厦门大学学报(自然科学版);2005年05期
8 杨炳儒;宋威;徐章艳;;基于内在认知机理的知识发现理论及其应用[J];自然科学进展;2006年01期
9 杨硕妍;;国外知识发现研究进展可视化分析[J];科技管理研究;2014年07期
10 王宝英,王昆,张利萍,闫秀云;知识发现系统原型构架的研究[J];河北省科学院学报;2004年02期
相关会议论文 前10条
1 杨光飞;党延忠;;不完美数据中的知识发现研究综述[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
2 杨志豪;林鸿飞;;生物医学文献中的隐含知识发现[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 张文;唐锡晋;;知识发现与求知模式[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
4 万家华;刘冰;江早;;知识发现中的可视化技术[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 张荣明;邹湘军;顾邦军;;面向资源服务的知识发现系统研究[A];企业应用集成系统与技术学术研究会论文集[C];2006年
6 胡学钢;郭骏;王浩;袁兆山;;基于粗集与基于格结构的知识发现方法比较[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
7 王春雨;顾军华;;基于知识发现的公交客流分析平台[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
8 张世海;刘晓燕;涂庆;欧进萍;王光远;;知识发现及其在高层结构智能选型中应用[A];计算机技术在工程建设中的应用——第十二届全国工程建设计算机应用学术会议论文集[C];2004年
9 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年
10 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
相关重要报纸文章 前2条
1 陈志楠;挖掘“不为人知的艺术”[N];科技日报;2009年
2 本报记者 刘晓莹;大数据时代下的新科研[N];科技日报;2014年
相关博士学位论文 前10条
1 王显昌;基于模糊规则的知识发现与表示研究[D];大连理工大学;2015年
2 李存荣;产品制造信息中的知识发现及其应用研究[D];武汉理工大学;2006年
3 封毅;中医药知识发现可靠性研究[D];浙江大学;2008年
4 毕雪亮;基于知识发现的钻井工程优化理论及应用[D];大庆石油学院;2007年
5 张国庆;基于生物医学文献的知识发现方法研究[D];华中科技大学;2006年
6 祁瑞华;不完整数据分类知识发现算法研究[D];大连理工大学;2011年
7 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
8 蒙祖强;基于分类模型的知识发现机理和方法研究[D];中南大学;2004年
9 朱正祥;领域驱动知识发现方法研究[D];大连理工大学;2010年
10 梁协雄;数据库中的知识发现及其应用研究[D];重庆大学;2004年
相关硕士学位论文 前10条
1 李洋;癌症基因表达数据属性偏序表示与知识发现[D];燕山大学;2015年
2 宋巧云;基于电力系统大数据集的知识发现方法的研究与实现[D];济南大学;2015年
3 吴剑峰;大数据时代面向知识发现的网络信息提取方法研究[D];安徽理工大学;2016年
4 姚远;基于情景分析的图书馆知识发现服务系统功能定位研究[D];江苏大学;2016年
5 王博妮;基于属性偏序结构原理的中药近红外光谱知识发现研究[D];燕山大学;2016年
6 边红;医学诊断系统中专家知识发现与推理算法研究[D];燕山大学;2016年
7 张帅;基于属性偏序原理的针灸有效点的知识发现与应用研究[D];燕山大学;2016年
8 刘敏;基于大数据知识发现的复杂机电设备维护研究与应用[D];重庆大学;2016年
9 孙鹏;知识发现在学科服务中的应用研究[D];东北师范大学;2010年
10 陈圣青;基于本体的知识发现系统框架研究[D];南京航空航天大学;2009年
,本文编号:1567572
本文链接:https://www.wllwen.com/kejilunwen/yysx/1567572.html