当前位置:主页 > 科技论文 > 软件论文 >

基于粒计算的混合属性数据增量式知识获取方法研究

发布时间:2022-01-14 14:53
  随着工业物联网的快速普及,各领域中的海量复杂数据推动着企业的快速发展。但如何删除海量复杂数据中的数据噪音,获取对企业有价值的数据信息已经成为了当前信息科学的一大难题。此外,各领域中获取的数据在动态地变化着,如何有效利用新旧数据之间的关系对有价值的信息进行高效更新也是信息科学领域的重要问题之一。粒计算采用分而治之的策略,可以有效对动态系统中的知识进行更新,获取数据中包含的潜在价值。本文利用粒计算理论中简化复杂问题的方法及邻域粗糙集模型中混合数据的度量方式,以属性约简结果知识粒度的增量计算为技术手段,研究了混合动态信息系统中数据变化时的增量式属性约简算法。本文的主要成果包括:(1)为了提高在属性集发生变化时混合动态信息系统中属性约简结果的更新效率,本文首先分析了具有混合属性数据知识粒度的计算方式,然后探索了混合信息系统下属性增加时基于邻域模型的知识粒度增量更新的规律,基于此设计了一种针对混合信息系统中属性集变化时的增量式约简算法。并利用UCI数据集进行相关仿真实验对所提出算法的有效性进行了验证;(2)为了提高在样本集发生变化时混合动态信息系统中属性约简结果的更新效率,本文首先利用邻域模型下... 

【文章来源】:南京财经大学江苏省

【文章页数】:61 页

【学位级别】:硕士

【部分图文】:

基于粒计算的混合属性数据增量式知识获取方法研究


本文组织结构图

示意图,粗糙集,经典,边界域


V为一个信息函数,这个信息函数为每一个属性指定一x U , ( , )af x a V[4]。.2 在信息系统 DIS (U , A, V , f)中,B C, IND ( B ) { b B,其中 x , y U ( x y)称为不可分辨关系。包含集B在论域U 上导出的划分记为 U / IND ( B)[4]。.3 在信息系统 IS (U , A, V , f)中,对于 X U, B C,集合以及 X 的边界域可定义为[4]:B ( X ) { x U :[ x ] B X}B( X) {x U:[x]X }B ( ) ( ) ( )BBND X B X B X集 B ( X )也被称为 X 的 B 正区域,记为 ( )BPOS X ;(BNEG 负区域。样本集合 X 的关于条件属性集 B 的等价类、下、负区域和边界域的示意图如图 2.1 所示。

约简,分类精度,样本


Segment 15 13 13.67 12 6.80Mushroom 4 4 109.35 4 35.36图4.1 样本增加时约简结果的NavieBayes分类精度

【参考文献】:
期刊论文
[1]粗等价粒度下基于多种加速策略的增量式求核算法[J]. 赵洁,张恺航,董振宁,梁俊杰,徐克付.  计算机科学. 2017(01)
[2]基于粗糙集的属性约简在数据挖掘中的应用研究[J]. 张颖淳,苏伯洪,曹娟.  计算机科学. 2013(08)
[3]知识粒度计算的矩阵方法及其在属性约简中的应用[J]. 王磊,叶军.  计算机工程与科学. 2013(03)
[4]基于信息熵的属性约简算法及应用[J]. 陈媛,杨栋.  重庆理工大学学报(自然科学). 2013(01)
[5]物联网:概念、架构与关键技术研究综述[J]. 孙其博,刘杰,黎羴,范春晓,孙娟娟.  北京邮电大学学报. 2010(03)
[6]Hash快速属性约简算法[J]. 刘勇,熊蓉,褚健.  计算机学报. 2009(08)
[7]一种基于粗糙集理论的快速并行属性约简算法[J]. 肖大伟,王国胤,胡峰.  计算机科学. 2009(03)
[8]基于邻域粗糙集的符号与数值属性快速约简算法[J]. 胡清华,赵辉,于达仁.  模式识别与人工智能. 2008(06)
[9]基于新的条件熵的决策表约简方法[J]. 徐久成,孙林,马媛媛.  计算机工程与设计. 2008(09)
[10]一种基于改进差别矩阵的核增量式更新算法[J]. 杨明.  计算机学报. 2006(03)



本文编号:3588700

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3588700.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户26ef9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com