基于DBIRCH算法的Argo剖面数据聚类
发布时间:2021-08-26 21:38
为解决实时分析处理的海洋Argo浮标剖面观测数据特有的数据密度较高、快速响应且需要识别任意形状簇等问题,提出了一种可通过单次扫描数据集进行有效处理的低复杂度聚类算法DBIRCH(Density-Based Balanced Iterative Reducing and Clustering Using Hierarchies)。该算法通过使用新引入的参数密度阈值修正因子,动态的更新限制CF(Clustering Feature)树生长的约束系数子空间阈值,同时结合密度关联思想在不同邻域内多次建立CF树且合并,最终以核心CF树子节点为聚类结果输出,避免了BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)算法对参数的过度依赖,同时因能处理任意形状簇从而提升了数据处理的整体鲁棒性,提高了处理Argo剖面监测数据的时效性和算法的整体吞吐速度。为测试算法的综合性能,使用真实Argo浮标剖面实时监测数据集,并根据不同的参数对算法做出多组对比实验,同时使用不同评价指标对算法从运行时间和聚类准确率上进行综合评估,从全局...
【文章来源】:吉林大学学报(信息科学版). 2020,38(05)
【文章页数】:10 页
【部分图文】:
DBIRCH算法过程示意图
DBIRCH算法共分为3个阶段,其算法详细流程如图2所示。输入:数据集D={x1,x2,x3,…,xn},非叶节点平衡因子B,叶节点平衡因子L,全局空间阈值T,密度系数ω。
为测试改进算法在处理Argo剖面监测数据时真实聚类效果,实验使用Argo实时资料中心(http:∥www.argo.org.cn/)的Argo浮标实时剖面观测资料,对算法进行性能评估[11]。数据来自多个Argo浮标不同时间段循环观测所采集的包括温度(TEMP)、盐度(PSAL)及压力(PRES)等多种属性的大量实时样本。同时考虑实验环境运算能力有限,仅截取2018年2月到2019年2月共计15 000余条剖面监测数据对3种不同算法进行对比实验,其DBIRCH算法聚类结果如图6所示。3.2 数据标准化处理
【参考文献】:
期刊论文
[1]非确定波动率下期权定价模型的有限体积法[J]. 甘小艇,徐登国,赵仁庆. 吉林大学学报(理学版). 2019(05)
[2]模糊综合评判的系统聚类算法研究[J]. 邹晨红,袁满. 吉林大学学报(信息科学版). 2018(05)
[3]基于知识图谱的自适应学习系统知识模型构建[J]. 朱艳茹,范亚芹,赵洋. 吉林大学学报(信息科学版). 2018(03)
[4]Argo资料协同管理方法研究[J]. 董贵莹,曹敏杰,张丰,杜震洪,刘仁义,吴森森. 海洋学研究. 2017(03)
[5]COPEX和HM2000与APEX型剖面浮标比测试验及资料质量评价[J]. 卢少磊,孙朝辉,刘增宏,许建平. 海洋技术学报. 2016(01)
[6]一种改进的BRICH算法及其应用[J]. 张虎,陈建斌,魏欢. 软件导刊. 2015(10)
[7]Argo浮标温盐剖面观测资料的质量控制技术[J]. 王辉赞,张韧,王桂华,安玉柱,金宝刚. 地球物理学报. 2012(02)
硕士论文
[1]改进的BIRCH算法在电信客户细分中的应用[D]. 杨晓斌.合肥工业大学 2015
本文编号:3365012
【文章来源】:吉林大学学报(信息科学版). 2020,38(05)
【文章页数】:10 页
【部分图文】:
DBIRCH算法过程示意图
DBIRCH算法共分为3个阶段,其算法详细流程如图2所示。输入:数据集D={x1,x2,x3,…,xn},非叶节点平衡因子B,叶节点平衡因子L,全局空间阈值T,密度系数ω。
为测试改进算法在处理Argo剖面监测数据时真实聚类效果,实验使用Argo实时资料中心(http:∥www.argo.org.cn/)的Argo浮标实时剖面观测资料,对算法进行性能评估[11]。数据来自多个Argo浮标不同时间段循环观测所采集的包括温度(TEMP)、盐度(PSAL)及压力(PRES)等多种属性的大量实时样本。同时考虑实验环境运算能力有限,仅截取2018年2月到2019年2月共计15 000余条剖面监测数据对3种不同算法进行对比实验,其DBIRCH算法聚类结果如图6所示。3.2 数据标准化处理
【参考文献】:
期刊论文
[1]非确定波动率下期权定价模型的有限体积法[J]. 甘小艇,徐登国,赵仁庆. 吉林大学学报(理学版). 2019(05)
[2]模糊综合评判的系统聚类算法研究[J]. 邹晨红,袁满. 吉林大学学报(信息科学版). 2018(05)
[3]基于知识图谱的自适应学习系统知识模型构建[J]. 朱艳茹,范亚芹,赵洋. 吉林大学学报(信息科学版). 2018(03)
[4]Argo资料协同管理方法研究[J]. 董贵莹,曹敏杰,张丰,杜震洪,刘仁义,吴森森. 海洋学研究. 2017(03)
[5]COPEX和HM2000与APEX型剖面浮标比测试验及资料质量评价[J]. 卢少磊,孙朝辉,刘增宏,许建平. 海洋技术学报. 2016(01)
[6]一种改进的BRICH算法及其应用[J]. 张虎,陈建斌,魏欢. 软件导刊. 2015(10)
[7]Argo浮标温盐剖面观测资料的质量控制技术[J]. 王辉赞,张韧,王桂华,安玉柱,金宝刚. 地球物理学报. 2012(02)
硕士论文
[1]改进的BIRCH算法在电信客户细分中的应用[D]. 杨晓斌.合肥工业大学 2015
本文编号:3365012
本文链接:https://www.wllwen.com/kejilunwen/haiyang/3365012.html