当前位置:主页 > 科技论文 > 软件论文 >

数据流模型下k-means聚类核心集的算法

发布时间:2021-11-22 18:40
  聚类是将给定的集合按照某种特征进行分类的过程,其应用于各个领域,为各行业的发展提供便利,具有极高的实用价值。按照分类方法的不同,聚类可以分为很多种,但其中应用最广的是fk-means聚类。fk-means聚类问题可以表述为:给定Rd上含有n个点的集合P和一个整数fk,目标是在Rd上找出fk个中心点,使得P中每个点到距它最近的中心点的距离的平方和最小。不同于一般的fk-meams聚类问题,在数据流模型下的fk-means聚类问题中,集合P中的点是随时间依次到达的,且数据量极其庞大没有足够的空间来存储全部的数据点。因此,为了解决该模型下的fk-means聚类问题,我们引入了核心集这一概念,较原始集合P而言,核心集规模更小,更便于储存,并且在所求得的核心集上进行聚类得到的解与在原始集合P上聚类得到的解之间的相对误差可以任意小。然而,fk-means聚类问题是NP-难问题,在P≠NP的假设下,不存在多项式时间的精确算法。因此,本文首先考虑了 fk-means聚类问题所得解为近似解时,如何计算原始集合的核心集。我们发现在近似解的情况下,无法找到满足定义的真正的核心集,但可以得到带有微小误差的近似... 

【文章来源】:北京工业大学北京市 211工程院校

【文章页数】:38 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景以及研究意义
    1.2 国内外研究现状
    1.3 k-means聚类
    1.4 预备知识
    1.5 论文结构
第2章 k-means聚类的(k,ε)-核心集构建算法
    2.1 算法介绍
    2.2 算法及主要结论
    2.3 算法分析
    2.4 本章小结
第3章 k-means聚类的ξ-近似(k,ε)-核心集构建算法
    3.1 算法介绍
    3.2 算法及主要结论
    3.3 算法分析
    3.4 本章小结
结论
参考文献
致谢


【参考文献】:
期刊论文
[1]κ-均值算法的初始化方法综述[J]. 徐大川,许宜诚,张冬梅.  运筹学学报. 2018(02)
[2]k-平均问题及其变形的算法综述[J]. 徐大川,许宜诚,张冬梅.  运筹学学报. 2017(02)



本文编号:3512246

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3512246.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5007d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com