基于密度-距离的t混合模型流式数据聚类
本文选题:t-混合模型 + 密度-距离中心算法 ; 参考:《仪器仪表学报》2017年09期
【摘要】:传统流式数据采用人工设门法分析,效率低下且依赖于专家。近几年,很多自动流式数据聚类算法纷纷被提出,然而针对数据量不多且分布稀疏的小样本类群始终没有很好的解决办法。提出了一种基于密度-距离的t-混合模型流式数据聚类优化方法,能够较好地解决小样本类群区分困难的问题。该方法通过密度-距离中心算法定位各类群的初始中心,作为t-混合算法的初值对样本数据进行处理,通过最大似然估计求出各类群对应的样本数目,从而实现样本聚类。实验表明,与经典模型算法相比,基于密度-距离的t-混合模型优化算法具有更好的稳定性和可靠性,对小样本类群以及混叠的类群具有较强的适应能力。
[Abstract]:The traditional flow data is analyzed by manual gate setting, which is inefficient and depends on experts. In recent years, many automatic flow data clustering algorithms have been proposed. However, there is no good solution to the small sample cluster which has a small amount of data and sparse distribution. In this paper, a density-distance based clustering optimization method for t- hybrid model flow data is proposed, which can solve the problem of small sample clustering. This method uses the density-distance center algorithm to locate the initial center of various groups and processes the sample data as the initial value of the t- hybrid algorithm. The maximum likelihood estimation is used to calculate the number of samples corresponding to the various groups, so that the sample clustering can be realized. The experimental results show that the density distance based thybrid model optimization algorithm has better stability and reliability than the classical model algorithm, and has a strong adaptability to small sample groups and aliasing groups.
【作者单位】: 上海大学机电工程与自动化学院;上海市智能制造及机器人重点实验室;上海纳衍生物科技有限公司;
【基金】:上海市浦江人才计划(17PJ1432300)项目资助
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 詹勇;杨燕;王红军;;混合模型的微博交叉话题发现[J];计算机科学与探索;2013年08期
2 张大明;符茂胜;郭慧;罗斌;;基于惩罚距离的混合模型分量数自动估计算法[J];华南理工大学学报(自然科学版);2009年10期
3 戴丽丽;宋余庆;陈健美;谢从华;;遗传K-均值初始化的t混合模型医学图像聚类[J];计算机应用研究;2010年08期
4 谢从华;宋余庆;陈健美;常晋义;;医学图像的混合模型成份数估计[J];计算机科学;2010年10期
5 王立国;张晶;;基于线性光谱混合模型的光谱解混改进模型[J];光电子.激光;2010年08期
6 夏睿;宗成庆;;情感文本分类混合模型及特征扩展策略[J];智能系统学报;2011年06期
7 刘建伟;李卫民;;基于摘要技术的混合模型流数据聚类算法[J];计算机科学;2009年11期
8 李腊元;通信协议形式描述的一种混合模型研究[J];计算机工程与设计;1989年01期
9 江欢;汤进;郭玉堂;罗斌;;基于t混合模型的自动图像标注[J];计算机技术与发展;2010年10期
10 李腊元;适于通信协议形式描述的一种混合模型[J];计算机学报;1988年05期
相关会议论文 前5条
1 沈乐君;;基于混合模型的多目标实时跟踪算法[A];2013体育计算机应用论文集[C];2013年
2 汪传建;李晓光;王大玲;于戈;;一种基于混合模型的文本分类器的研究与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 徐斌;马尽文;;一种柯西混合模型上梯度型BYY和谐学习算法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
4 赵广建;,
本文编号:1880777
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1880777.html