当前位置:主页 > 科技论文 > 软件论文 >

Spark框架下优势关系粗糙集动态属性约简方法研究

发布时间:2021-03-21 17:17
  知识发现(Knowledge Discovery in Database,KDD)的主要目标是通过转换、抽取等一系列手段从原始知识库中挖掘出对人们有价值知识的过程。属性约简(或称特征选择、特征降维)是一种通过某种方法从原始特征空间中删除不必要的属性达到降低数据维度的有效方法,它是机器学习和数据挖掘领域中数据预处理的重要步骤之一。目前特征选择已经广泛应用在图像处理、文本分类、语音识别等领域。近年来,信息科技的高速发展不仅给人们生活带来便捷体验,同时还给各个领域带来了前所未有的机遇和挑战,数据的共享使得数据类型更加多样化。如何从这些高维度、复杂、动态变化的数据中挖掘出有价值的知识已成为学者们关注的研究内容之一。本文以优势关系粗糙集在动态环境下如何高效获取属性约简为出发点,分别针对优势决策信息系统中动态改变对象、属性、属性值的情况下,高效动态属性约简获取的问题进行相关的研究。本文的主要研究内容如下:1.对象动态变化时,阐述了优势决策信息系统中增加单个对象时优势集的变化规律,给出了优势决策信息系统动态更新属性约简的定理,设计了增加单个对象后优势决策信息系统增量更新属性约简的算法,通过UCI机器... 

【文章来源】:西南交通大学四川省 211工程院校 教育部直属院校

【文章页数】:86 页

【学位级别】:硕士

【部分图文】:

Spark框架下优势关系粗糙集动态属性约简方法研究


论文组织结构图

过程图,过程,属性重要度,下近似集


图 2-1 Spark 任务提交过程 本章小结本章主要介绍了粗糙集理论中所涉及到的基本概念和基本定理。首先给出了集中有关基础定义、定理和性质等,主要包括等价类、上近似集、下近似集、概念,随后又简单介绍了优势关系粗糙集,以及属性重要度度量指标和启发简等基础知识,最后简单介绍了 Spark 任务提交的过程。以上内容为讲解后续理论基础。

特征数目,原始特征,选择后,数目


果分析从以下方面对实验结果进行解释和说明。前、后特征数目比较前后特征数目对比如表 3-3 和图 3-1 所示,从结果可以看有数据集下都能从原始属性中约简掉不必要的属性,对于 D,这表明属性约简算法更适合处理高维特征的数据。表中的特征一致。表 3-3 非增量算法和增量算法约简结果和选择特征的数目集原始特征数目非增量算法选择的特征选择特征总数增量算法选择的特征 9 1,3,4,5,6,7,8,9 8 1,3,4,5,6,7,8,9 r 6 6,4,1,2,5 5 6,4,1,2,5 logy 344,5,7,9,14,15,16,20,21,22,25,26,28,29,31,33164,5,7,9,14,15,16,20,21,225,26,28,29,31,33 4 1,3,4 3 1,3,4 rative 8 3,4,6,7,8 5 3,4,6,7,8 e 13 1,2,3,4,5,6,7,10,11,12,13 11 1,2,3,4,5,6,7,10,11,12,1

【参考文献】:
期刊论文
[1]MapReduce框架下并行知识约简算法模型研究[J]. 钱进,苗夺谦,张泽华,张志飞.  计算机科学与探索. 2013(01)
[2]Information entropy for ordinal classification[J]. HU QingHua , GUO MaoZu, YU DaRen & LIU JinFu Harbin Institute of Technology, Harbin 150001, China.  Science China(Information Sciences). 2010(06)
[3]一种基于条件熵的增量核求解方法[J]. 梁吉业,魏巍,钱宇华.  系统工程理论与实践. 2008(04)



本文编号:3093247

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3093247.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a33d4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com