基于拟蒙特卡洛的K均值聚类中心初始化方法
本文选题:K-means聚类 + 拟蒙特卡洛 ; 参考:《济南大学学报(自然科学版)》2017年01期
【摘要】:针对传统K-means算法随机选择初始聚类中心容易造成聚类结果不稳定且准确率低等问题,基于拟蒙特卡洛(Quasi-Monte Carlo,QMC)方法提出一种新的初始聚类中心确定方法;该算法利用QMC序列分布的超均匀性特点,对整个样本空间中的样本分布进行采样估计;基于k近邻距离(k-distance)对QMC序列点进行加权的K-means聚类,得到初始聚类中心。该算法的计算复杂度为O(max(d、n)logn),其中d、n分别表示样本数据的维数和数量;在人工数据和实际数据集上的仿真实验表明,该算法能选择更优的初始聚类中心,有效降低K-means算法的迭代次数,提高聚类的准确性、鲁棒性和收敛速度。
[Abstract]:Aiming at the problem that the traditional K-means algorithm is easy to select the initial clustering center at random, the result of clustering is unstable and the accuracy is low. A new method for determining the initial clustering center is proposed based on quasi-Monte Carlo method. Based on the heterogeneity of QMC sequence distribution, the sample distribution in the whole sample space is sampled and estimated, and the initial clustering center is obtained based on k-nearest neighbor distance weighted K-means clustering of QMC sequence points. The computational complexity of the algorithm is O _ (max.) DU _ (n), where dn represents the dimension and quantity of the sample data respectively, and the simulation results on the artificial data and the actual data set show that the algorithm can select a better initial clustering center. It can effectively reduce the number of iterations of K-means algorithm and improve the accuracy, robustness and convergence speed of clustering.
【作者单位】: 中国计量大学理学院;中国计量大学量新学院;
【基金】:浙江省自然科学基金项目(LY14F030020)
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 元丁;;令人惊讶的张冠李戴[J];新闻战线;1992年09期
2 张文明;工作站环境中电路的蒙特卡洛分析[J];计算机应用研究;1997年02期
3 程康萱;;忆访棋王卫冕战——蒙特卡洛琐记[J];新闻三昧;1995年03期
4 董宽;;再见,蒙特卡洛——访申办2000年奥运会决战纪实[J];新闻三昧;1994年01期
5 闵涛;张帆;;参数反演的微分进化蒙特卡洛算法[J];计算机工程与应用;2012年07期
6 葛丽萍;鄂英杰;;运用Crystal Ball & MS Project实现项目进度的蒙特卡洛风险分析[J];电脑编程技巧与维护;2013年08期
7 张建平;张凤莲;陶华;;基于混合蒙特卡洛算法的容差分配研究[J];计算机仿真;2009年10期
8 马北北;;蒙特卡洛:举世瞩目的一天[J];青年记者;1994年01期
9 曲洪权;庞丽萍;李运泽;;序列蒙特卡洛滤波在卫星传热反问题中的应用[J];系统仿真学报;2008年13期
10 钱键民;;雷达虚警概率模拟与重要采样技术[J];火控雷达技术;1984年02期
相关会议论文 前3条
1 程磊;房永智;王刚;;蒙特卡洛计算方法与作战毁伤模拟决策分析[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
2 周永宏;郑大伟;廖新浩;;相关分析显著水平的蒙特卡洛模拟检验[A];中国地球物理学会年刊2002——中国地球物理学会第十八届年会论文集[C];2002年
3 康晓岩;陈永义;;一种改进的蒙特卡洛选择算子[A];中国系统工程学会模糊数学与模糊系统委员会第十一届年会论文选集[C];2002年
相关重要报纸文章 前6条
1 记者 王庆芳;蒙特卡洛三剑客聚首杂技节[N];石家庄日报;2005年
2 梁丽娟;1993:难忘蒙特卡洛[N];人民日报海外版;2008年
3 宋志坚;天价之中的特权成本[N];福建日报;2007年
4 阳映红 编译;充满挑战的再保业(下)[N];中国保险报;2014年
5 阳映红 编译;充满挑战的再保业(上)[N];中国保险报;2014年
6 李雨萌;李娜的税收哲学[N];大连日报;2014年
相关硕士学位论文 前10条
1 于永波;基于蒙特卡洛树搜索的计算机围棋博弈研究[D];大连海事大学;2015年
2 祁建娟;CDO信用风险度量的蒙特卡洛算法优化及应用[D];上海交通大学;2015年
3 梁金龙;铀部件质量丰度检测数据采集仿真系统研究[D];西南科技大学;2015年
4 王洋;基于蒙特卡洛理论的基因序列分析与仿真[D];广东工业大学;2016年
5 乔馨慧;磁场对容性及感应耦合等离子体性质影响的数值模拟研究[D];华中科技大学;2014年
6 邓斌;基于蒙特卡洛算法的锚泊容量研究[D];大连海事大学;2012年
7 徐麟;基于蒙特卡洛分析的港口项目财务风险研究[D];大连海事大学;2008年
8 谢东;基于蒙特卡洛技术的中国移动无线网优项目时间管理研究[D];安徽大学;2012年
9 夏勇;基于蒙特卡洛的动态无线传感器网络节点定位算法研究[D];辽宁科技大学;2014年
10 肖峰;GPU高性能运算在计算机围棋博弈系统中的应用研究及实验[D];北京邮电大学;2011年
,本文编号:1859494
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1859494.html