混合数据最佳聚类数的确定方法与应用
发布时间:2021-08-18 10:00
随着“大数据”一词的频繁出现,数据挖掘也成了一个热点名词,它代表着将大而杂的数据转换成信息的一个综合过程,聚类分析是它的重要研究方向之一。聚类算法是聚类分析的重要工具,而聚类数目往往是决定聚类算法性能的关键,鉴于大部分聚类算法需要预先给定类别数的现状,因此确定最佳聚类数是我们更好地进行数据挖掘重要一步。由于研究问题的日益复杂化,越来越多的混合属性数据成为了处理对象,然而针对混合数据的聚类研究却没有得到很好的发展,所以针对混合数据的聚类有效性研究并以此来确定最佳聚类数在当今时代具有针对性和适用性。本文在大数据背景下,分析了混合属性数据的聚类有效性问题的重要性,进而对聚类有效性问题进行深入研究;之后针对现有的聚类算法的缺点进行改进以提高算法的效能,最后结合D-S证据理论提出针对混合属性数据提出DSKP算法,并总结该算法的优越性和特点,提出聚类有效性未来的可能发展方向。在改进聚类算法方面,做了如下几个方面的创新工作:(1)基于数据属性的特征确定初始聚类中心以降低初始聚类中心选择的随机性,同时针对大型数据提出进行简单随机抽样的处理方式,以达到降低异常值对聚类结果的影响和提高算法运行效率的目的。...
【文章来源】:兰州财经大学甘肃省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
聚类算法分类及特点
最佳聚类数的一般确定流程
【参考文献】:
期刊论文
[1]改进的模糊K-Prototypes聚类算法在研究生培养质量评估中的应用[J]. 乔秀峰,张德珍,吴迅,张俊. 中国管理信息化. 2018(07)
[2]K-means算法最佳聚类数评价指标研究[J]. 郭靖,侯苏. 软件导刊. 2017(11)
[3]基于均匀抽样的二阶差分聚类数确定方法[J]. 陈艳,陈光,易叶青,刘强. 计算机与现代化. 2017(10)
[4]最近最远得分的聚类性能评价指标[J]. 冯柳伟,常冬霞,邓勇,赵耀. 智能系统学报. 2017(01)
[5]确定最佳聚类数的二阶差分统计法[J]. 崔建斌,姬安召,张科. 安徽大学学报(自然科学版). 2017(02)
[6]基于聚类中心优化的k-means最佳聚类数确定方法[J]. 贾瑞玉,宋建林. 微电子学与计算机. 2016(05)
[7]混合属性数据k-prototypes聚类算法[J]. 余文利,余建军,方建文. 计算机系统应用. 2015(06)
[8]基于信息熵的粗糙K-prototypes聚类算法[J]. 欧阳浩,戴喜生,王智文,王萌. 计算机工程与设计. 2015(05)
[9]基于信息增益的模糊K-prototypes聚类算法[J]. 欧阳浩,王智文,戴喜生,刘智琦. 计算机工程与科学. 2015(05)
[10]模糊C均值算法的聚类有效性评价[J]. 朴尚哲,超木日力格,于剑. 模式识别与人工智能. 2015(05)
博士论文
[1]聚类分析中的最佳聚类数确定方法研究及应用[D]. 周世兵.江南大学 2011
[2]模糊聚类新算法与聚类有效性问题研究[D]. 范九伦.西安电子科技大学 1998
硕士论文
[1]研究生培养质量评估的一种改进模糊K-Prototypes聚类算法[D]. 乔秀峰.大连海事大学 2018
[2]基于大数据的聚类算法研究及应用[D]. 王丽君.山东科技大学 2017
[3]k-均值聚类算法的改进与实现[D]. 董骐瑞.吉林大学 2015
[4]k-means聚类算法的改进研究及其应用[D]. 王康.大连理工大学 2014
[5]面向混合数据的划分式聚类算法研究[D]. 常茜茜.太原理工大学 2013
[6]聚类分析中确定最佳聚类数的若干问题研究[D]. 宋媛.延边大学 2013
[7]基于连通性的聚类有效性问题研究[D]. 张尚超.北京交通大学 2010
本文编号:3349679
【文章来源】:兰州财经大学甘肃省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
聚类算法分类及特点
最佳聚类数的一般确定流程
【参考文献】:
期刊论文
[1]改进的模糊K-Prototypes聚类算法在研究生培养质量评估中的应用[J]. 乔秀峰,张德珍,吴迅,张俊. 中国管理信息化. 2018(07)
[2]K-means算法最佳聚类数评价指标研究[J]. 郭靖,侯苏. 软件导刊. 2017(11)
[3]基于均匀抽样的二阶差分聚类数确定方法[J]. 陈艳,陈光,易叶青,刘强. 计算机与现代化. 2017(10)
[4]最近最远得分的聚类性能评价指标[J]. 冯柳伟,常冬霞,邓勇,赵耀. 智能系统学报. 2017(01)
[5]确定最佳聚类数的二阶差分统计法[J]. 崔建斌,姬安召,张科. 安徽大学学报(自然科学版). 2017(02)
[6]基于聚类中心优化的k-means最佳聚类数确定方法[J]. 贾瑞玉,宋建林. 微电子学与计算机. 2016(05)
[7]混合属性数据k-prototypes聚类算法[J]. 余文利,余建军,方建文. 计算机系统应用. 2015(06)
[8]基于信息熵的粗糙K-prototypes聚类算法[J]. 欧阳浩,戴喜生,王智文,王萌. 计算机工程与设计. 2015(05)
[9]基于信息增益的模糊K-prototypes聚类算法[J]. 欧阳浩,王智文,戴喜生,刘智琦. 计算机工程与科学. 2015(05)
[10]模糊C均值算法的聚类有效性评价[J]. 朴尚哲,超木日力格,于剑. 模式识别与人工智能. 2015(05)
博士论文
[1]聚类分析中的最佳聚类数确定方法研究及应用[D]. 周世兵.江南大学 2011
[2]模糊聚类新算法与聚类有效性问题研究[D]. 范九伦.西安电子科技大学 1998
硕士论文
[1]研究生培养质量评估的一种改进模糊K-Prototypes聚类算法[D]. 乔秀峰.大连海事大学 2018
[2]基于大数据的聚类算法研究及应用[D]. 王丽君.山东科技大学 2017
[3]k-均值聚类算法的改进与实现[D]. 董骐瑞.吉林大学 2015
[4]k-means聚类算法的改进研究及其应用[D]. 王康.大连理工大学 2014
[5]面向混合数据的划分式聚类算法研究[D]. 常茜茜.太原理工大学 2013
[6]聚类分析中确定最佳聚类数的若干问题研究[D]. 宋媛.延边大学 2013
[7]基于连通性的聚类有效性问题研究[D]. 张尚超.北京交通大学 2010
本文编号:3349679
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3349679.html