面向不确定性数据聚类方法的初步研究

发布时间:2021-05-15 20:55
  目前,数据呈现出海量性以及多样性,给数据挖掘和聚类分析带来了极大困难,另外真实数据中往往存在着不确定性,这种不确定性使得挖掘出有价值的信息变得更加困难。所以,近年来,如何能有效的从不确定数据集中提取出有价值的信息成为研究热点之一。不确定数据主要分为存在级和属性级不缺性,为了能更好的理解这两种不确定数据,本文主要做了以下工作:第一,本文在第三章中提出ULDC算法,用于对不确定数据进行聚类分析,该算法是在学习基于密度的面向不确定数据的聚类算法时,发现某些算法在对不确定数据进行聚类时,有一些缺点。针对这些缺点,提出一种基于局部密度的ULDC算法。首先改进不确定数据对象之间相似性的度量方式,然后介绍ULDC算法所涉及的相关概念,比如局部密度、数据链等,最后描述该算法的整体流程。该算法主要是将局部密度作为不确定数据对象唯一的属性来进行聚类分析,并且,与DBSCAN等算法相比,该算法减少了参数值的个数,由此提高聚类结果的质量。通过实验验证,该算法在Iris数据集合Connect-4数据集上的F1值分别为0.8876和0.9086,说明该算法有比较好的聚类质量。第二,本文在第四章中提出UBFCM算法... 

【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究的背景与意义
    1.2 国内外研究现状
    1.3 不确定数据概述
        1.3.1 产生原因
        1.3.2 不确定数据的表现形式
        1.3.3 不确定数据的应用
    1.4 论文的组织结构
    1.5 本章小结
第二章 聚类相关理论基础
    2.1 聚类概述
    2.2 聚类相关数学模型
    2.3 相似性度量
    2.4 确定数据聚类算法
        2.4.1 基于划分的聚类算法
        2.4.2 基于层次的聚类算法
        2.4.3 基于密度的聚类算法
        2.4.4 基于网格的聚类算法
    2.5 不确定数据聚类算法
        2.5.1 不确定数据与确定数据聚类算法的区别
        2.5.2 基于划分的不确定数据聚类算法
        2.5.3 基于密度的不确定数据聚类算法
        2.5.4 基于概率分布的不确定数据聚类算法
    2.6 不确定数据相似性度量
第三章 本文所提一种基于局部密度的ULDC算法
    3.1 研究的背景和意义
    3.2 聚类算法相关准备
        3.2.1 不确定对象相异度
        3.2.2 如何确定聚类中心
    3.3 本文所提ULDC不确定数据聚类算法
        3.3.1 改进不确定数据对象之间相似性计算公式
        3.3.2 ULDC算法相关定义
        3.3.3 算法描述
    3.4 算法性能以及仿真实验
        3.4.1 算法的复杂度分析
        3.4.2 实验结果与分析
    3.5 本章小结
第四章 本文所提一种基于模糊划分的UBFCM算法
    4.1 研究的动机与意义
    4.2 模糊C均值聚类算法介绍
    4.3 本文所提UBFCM不确定数据聚类算法
        4.3.1 不确定数据聚类模型
        4.3.2 不确定数据聚类的确定化
        4.3.3 相似度计算公式
        4.3.4 不确定数据聚类算法UBFCM算法描述
    4.4算法性能分析及实验
        4.4.1 算法的时间复杂度分析
        4.4.2 实验结果与分析
    4.5 本章小结
第五章 总结与展望
    5.1 本文工作总结
    5.2 工作展望
参考文献
作者简介
致谢


【参考文献】:
期刊论文
[1]多中心点增量式模糊聚类算法[J]. 胡本固,戴牡红.  应用科学学报. 2019(06)
[2]一种基于属性空间相似性的模糊聚类算法[J]. 施伟锋,卓金宝,兰莹.  电子与信息学报. 2019(11)
[3]高维不确定数据的子空间聚类算法[J]. 万静,郑龙君,何云斌,李松.  计算机应用. 2019(11)
[4]基于区间数的不确定性数据聚类算法:UD-OPTICS[J]. 吴翠先,何少元.  计算机工程与科学. 2019(07)
[5]混合型数据聚类方法的比较[J]. 刘超,姚清华,乐然.  统计与决策. 2019(11)
[6]基于密度的不确定数据流聚类算法[J]. 韩东红,宋明,张宏亮,王佳茜,王嘉兴,王国仁.  清华大学学报(自然科学版). 2017(08)
[7]基于快速高斯变换的不确定数据聚类算法[J]. 迟荣华,程媛,朱素霞,黄少滨,陈德运.  通信学报. 2017(03)
[8]一种空间相关性与隶属度平滑的FCM改进算法[J]. 肖满生,肖哲,文志诚,周立前.  电子与信息学报. 2017(05)
[9]基于近邻传播的不确定数据流演化聚类算法[J]. 夏聪,陆亿红.  模式识别与人工智能. 2016(05)
[10]不确定数据基于密度的局部异常点检测[J]. 曹科研,栾方军,孙焕良,丁国辉.  计算机学报. 2017(10)



本文编号:3188321

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3188321.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d126e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com