网格密度峰值聚类算法及城市热点区域提取
发布时间:2024-02-19 19:25
随着大数据的飞速发展,交通、医疗、电信等各个领域都产生了海量的数据,分析并挖掘出海量数据内部隐含的信息并用以辅助决策越来越重要。数据挖掘是一种分析海量数据内部潜在规律的重要手段,可以自动寻找数据中包含的模式和趋势。而聚类是一种重要的数据挖掘方法,在图像处理、模式识别、知识发现等领域都有着重要的应用。然而,数据量的大规模增长对聚类算法的运算精度和运算时间都有着较高的要求,因此聚类算法也需要不断改进以适应大规模数据的需求。城市热点区域一直被视为研究居民流动规律的重要手段,而出租车的GPS数据具有易获取、应用价值高、数据量大等特点,因此使用出租车数据进行城市热点区域的提取与分析,得到的结果可以为人们出行提供合适的指导并提高城市资源的利用效率。基于密度的聚类算法具有对异常点不敏感、可以聚类任意形状的簇等优点。2014年Alex等人提出了一种密度峰值聚类算法(DPC),它是一种新的基于密度的聚类算法,该算法只需要计算两个参数:局部密度?和高密度距离?,算法的计算过程简单并且无需事先指定聚类中心,因此迅速得到了广泛的应用。但是DPC算法在聚类时需要计算所有数据点之间的相关参数,因此算法的时间复杂度...
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究问题
1.1.3 研究意义
1.2 国内外研究现状
1.2.1 密度聚类算法研究现状
1.2.2 城市热点区域提取研究现状
1.3 研究内容及技术路线
1.3.1 主要研究内容
1.3.2 技术路线
1.4 本文的组织结构
2 相关理论与方法
2.1 密度峰值聚类算法
2.2 网格聚类算法
2.3 城市热点区域提取方法
3 网格K近邻密度峰值聚类算法
3.1 网格密度峰值聚类算法
3.2 网格K近邻密度峰值聚类算法
3.3 算法复杂度分析
3.4 数值实验
3.5 本章小结
4 城市热点区域提取与分析
4.1 工作日与周末热点区域动态变化分析
4.1.1 数据预处理
4.1.2 聚类过程及结果分析
4.2 节假日热点区域分析
4.3 热点区域连接紧密程度分析
4.3.1 不同簇间的连接紧密程度
4.3.2 簇内的连接紧密程度
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
本文编号:3903202
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究问题
1.1.3 研究意义
1.2 国内外研究现状
1.2.1 密度聚类算法研究现状
1.2.2 城市热点区域提取研究现状
1.3 研究内容及技术路线
1.3.1 主要研究内容
1.3.2 技术路线
1.4 本文的组织结构
2 相关理论与方法
2.1 密度峰值聚类算法
2.2 网格聚类算法
2.3 城市热点区域提取方法
3 网格K近邻密度峰值聚类算法
3.1 网格密度峰值聚类算法
3.2 网格K近邻密度峰值聚类算法
3.3 算法复杂度分析
3.4 数值实验
3.5 本章小结
4 城市热点区域提取与分析
4.1 工作日与周末热点区域动态变化分析
4.1.1 数据预处理
4.1.2 聚类过程及结果分析
4.2 节假日热点区域分析
4.3 热点区域连接紧密程度分析
4.3.1 不同簇间的连接紧密程度
4.3.2 簇内的连接紧密程度
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
本文编号:3903202
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3903202.html