逐段均匀条件下的参考分布研究
发布时间:2022-09-29 18:41
聚类分析的目标是对一组对象进行聚类,使同一集群之间的对象之间在某种意义上比其他集群中的对象更相似,它是探索性数据挖掘的主要任务。聚类分析主要研究两类问题:一是对给定簇数如何合理的进行聚类,二是如何合理的估计簇数。本文研究第二个问题中GS方法的参考分布问题。Tibshirani R等人在2000年提出GS(Gap Statisic)方法,该方法引入一个参考分布,通过比较参考数据集和样本数据集的类内离差程度来估计最佳聚类数,并得到在分布为对数凹且一维情况下,参考分布为均匀分布的结论。因此,根据已有结论,GS方法适用于一维且对数凹情况下的数据集,但并不知道是否适用于不满足该条件数据集的最佳聚类数估计。本文提出研究逐段均匀条件下GS方法不同维度的参考分布问题。首先,应用Lagrange乘数法求解最小化类内平方和条件下的参数估计问题,其次,从范数的角度对同样的问题进行更深层次的论证。针对一维、二维的情况,得到了该条件下参考分布仍为均匀分布的结论,在此基础上证得在多维边缘为逐段均匀的条件下,其参考分布仍为均匀分布的结论。由此做出总结:针对任何有限维,逐段均匀分布条件下GS方法的参考分布都是均匀分布...
【文章页数】:43 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题的研究背景及意义
1.2 研究现状
1.2.1 聚类分析中最佳聚类数的研究现状
1.2.2 GS方法研究现状
1.3 论文研究的主要内容
1.3.1 论文的组织
1.3.2 论文的主要工作与创新
2 预备知识
2.1 聚类分析的定义
2.2 聚类分析算法
2.3 样本间距离
2.4 最佳聚类数k的估计
2.5 k-means算法
2.5.1 k-means算法概况
2.5.2 k-means算法定义
2.6 GS方法
2.6.1 选择参考分布
2.6.2 GS方法运算步骤
2.7 本章小结
3 基于Lagrange乘数法的GS方法参考分布研究
3.1 一维情况下GS参考分布研究
3.2 二维情况下GS参考分布研究
3.3 n维情况下GS参考分布研究
3.4 实证分析
3.5 本章小结
4 基于范数的GS方法参考分布研究
4.1 范数的定义
4.1.1 向量范数的定义
4.1.2 矩阵范数的定义
4.2 一维情况下GS参考分布研究
4.3 多维情况下GS参考分布研究
4.4 本章小结
5 结束语
致谢
参考文献
附录
【参考文献】:
期刊论文
[1]改进K-means算法优化RBF神经网络的出水氨氮预测[J]. 乔俊飞,孙玉庆,韩红桂. 控制工程. 2018(03)
[2]基于IGS方法的最佳分类数研究[J]. 窦婷,张正军. 重庆工商大学学报(自然科学版). 2017(06)
[3]基于标准化变换的求和法:一种新的样品聚类分析方法[J]. 郭春雪,沈宁,胡良平. 四川精神卫生. 2017(03)
[4]函数型数据聚类分析研究综述与展望[J]. 王德青,朱建平,刘晓葳,何凌云. 数理统计与管理. 2018(01)
[5]一种加权主成分距离的聚类分析方法[J]. 吕岩威,李平. 统计研究. 2016(11)
[6]基于Hash改进的k-means算法并行化设计[J]. 张波,徐蔚鸿,陈沅涛,朱玲. 计算机工程与科学. 2016(10)
[7]基于聚类分析和主成分分析法的杨梅营养品质评价研究[J]. 王伟,吕旭健,张玉,王强,邵歆,王君虹,朱作艺,李雪,胡桂仙. 食品工业科技. 2017(01)
[8]基于聚类分析的三阶段二级电压控制分区方法[J]. 鲍威,朱涛,赵川,吴涛,郭瑞鹏. 电力系统自动化. 2016(05)
[9]近5年护理研究热点的共词聚类分析[J]. 张方圆,李峥. 中华护理杂志. 2016(02)
[10]基于SPSS的共现聚类分析参数选择的实例研究[J]. 隋明爽,崔雷. 中华医学图书情报杂志. 2016(01)
硕士论文
[1]K-means聚类算法的改进研究[D]. 宋建林.安徽大学 2016
[2]基于加权MP马氏距离的GS方法研究[D]. 王振丽.南京理工大学 2016
[3]基于矩Gap统计的图像分割方法[D]. 陆琴琴.南京理工大学 2014
[4]基于GS方法的图像分割估计数的多信息动态研究[D]. 刘倩.南京理工大学 2013
[5]基于MFGS方法图像最佳分割数的研究[D]. 童波.南京理工大学 2011
本文编号:3683110
【文章页数】:43 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题的研究背景及意义
1.2 研究现状
1.2.1 聚类分析中最佳聚类数的研究现状
1.2.2 GS方法研究现状
1.3 论文研究的主要内容
1.3.1 论文的组织
1.3.2 论文的主要工作与创新
2 预备知识
2.1 聚类分析的定义
2.2 聚类分析算法
2.3 样本间距离
2.4 最佳聚类数k的估计
2.5 k-means算法
2.5.1 k-means算法概况
2.5.2 k-means算法定义
2.6 GS方法
2.6.1 选择参考分布
2.6.2 GS方法运算步骤
2.7 本章小结
3 基于Lagrange乘数法的GS方法参考分布研究
3.1 一维情况下GS参考分布研究
3.2 二维情况下GS参考分布研究
3.3 n维情况下GS参考分布研究
3.4 实证分析
3.5 本章小结
4 基于范数的GS方法参考分布研究
4.1 范数的定义
4.1.1 向量范数的定义
4.1.2 矩阵范数的定义
4.2 一维情况下GS参考分布研究
4.3 多维情况下GS参考分布研究
4.4 本章小结
5 结束语
致谢
参考文献
附录
【参考文献】:
期刊论文
[1]改进K-means算法优化RBF神经网络的出水氨氮预测[J]. 乔俊飞,孙玉庆,韩红桂. 控制工程. 2018(03)
[2]基于IGS方法的最佳分类数研究[J]. 窦婷,张正军. 重庆工商大学学报(自然科学版). 2017(06)
[3]基于标准化变换的求和法:一种新的样品聚类分析方法[J]. 郭春雪,沈宁,胡良平. 四川精神卫生. 2017(03)
[4]函数型数据聚类分析研究综述与展望[J]. 王德青,朱建平,刘晓葳,何凌云. 数理统计与管理. 2018(01)
[5]一种加权主成分距离的聚类分析方法[J]. 吕岩威,李平. 统计研究. 2016(11)
[6]基于Hash改进的k-means算法并行化设计[J]. 张波,徐蔚鸿,陈沅涛,朱玲. 计算机工程与科学. 2016(10)
[7]基于聚类分析和主成分分析法的杨梅营养品质评价研究[J]. 王伟,吕旭健,张玉,王强,邵歆,王君虹,朱作艺,李雪,胡桂仙. 食品工业科技. 2017(01)
[8]基于聚类分析的三阶段二级电压控制分区方法[J]. 鲍威,朱涛,赵川,吴涛,郭瑞鹏. 电力系统自动化. 2016(05)
[9]近5年护理研究热点的共词聚类分析[J]. 张方圆,李峥. 中华护理杂志. 2016(02)
[10]基于SPSS的共现聚类分析参数选择的实例研究[J]. 隋明爽,崔雷. 中华医学图书情报杂志. 2016(01)
硕士论文
[1]K-means聚类算法的改进研究[D]. 宋建林.安徽大学 2016
[2]基于加权MP马氏距离的GS方法研究[D]. 王振丽.南京理工大学 2016
[3]基于矩Gap统计的图像分割方法[D]. 陆琴琴.南京理工大学 2014
[4]基于GS方法的图像分割估计数的多信息动态研究[D]. 刘倩.南京理工大学 2013
[5]基于MFGS方法图像最佳分割数的研究[D]. 童波.南京理工大学 2011
本文编号:3683110
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3683110.html