基于出租车轨迹数据的并行化区域热点分析方法研究
发布时间:2021-07-28 01:10
目前,移动轨迹数据正成为研究热点,它为智慧城市以及研究城市计算的领域提供了重要的数据基础。出租车GPS轨迹数据的挖掘、分析与利用,为解决城市问题提供了新思路。本文基于改进的CLIQUE网格聚类算法和FP-growth算法对出租车GPS轨迹数据进行关联规则挖掘及应用。针对出租车热点区域推荐的问题,本文研究的主要内容及创新点如下:(1)使用基于高斯随机分布的自适应网格聚类算法(An improved CLIQUE based onGaussian Processes and adaptive division,GPAD-CLIQUE),改进了 GP-CLIQUE 算法的如下缺点:硬网格划分导致不当划分并破坏原始密集区域完整性的缺点,硬网格划分算法聚类结果对密度阈值非常敏感的缺点以及最小描述长度的策略剪枝导致密集单元不完整的缺点。并通过实验比较使用的GPAD-CLIQUE算法和基于高斯随机分布的CLIQUE网格算法以及CLIQUE网格算法对数据集进行网格聚类的结果,发现GPAD-CLIQUE算法在聚类结果中误码率相对较低,可靠性更高。(2)针对FP-growth算法需要扫描两次数据库才能构建...
【文章来源】:西安理工大学陕西省
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 国内外研究现状
1.2.2 现存问题及难点
1.3 研究框架及内容
1.3.1 研究框架
1.3.2 研究内容
1.4 本文的组织结构
2 出租车热点区域分析理论及相关技术
2.1 CLIQUE网格聚类
2.1.1 CLIQUE网格聚类算法思想
2.1.2 CLIQUE网格聚类算法过程
2.2 FP-growth算法
2.2.1 FP-growth算法基本思想
2.2.2 FP-growth算法过程
2.3 本章小结
3 基于CLIQUE网格聚类算法的改进
3.1 基于高斯过程的CLIQUE网格算法
3.1.1 相关定义
3.1.2 基于高斯随机分布的CLIQUE网格算法
3.2 改进的高斯随机分布的CLIQUE网格算法
3.2.1 改进动机
3.2.2 相关定义及原理性质
3.2.3 改进思路
3.2.4 改进方法
3.3 实验结果与分析
3.3.1 出租车数据预处理
3.3.2 实验环境
3.3.3 有效性评估
3.3.4 可靠性分析
3.3.5 停留点聚类结果
3.4 本章小结
4 基于并行FP-growth算法的改进
4.1 基于布尔矩阵的并行FP-growth算法
4.1.1 相关定义及原理
4.1.2 BPFP算法原理
4.2 改进的并行FP-growth算法
4.2.1 改进动机
4.2.2 相关定义
4.2.3 改进思路
4.2.4 改进方法
4.3 实验结果与分析
4.3.1 实验环境
4.3.2 串行算法和并行算法的性能对比
4.3.3 三种并行算法性能对比
4.3.4 不同分组策略性能对比
4.3.5 节点变化时基于两种框架的性能对比
4.3.6 出租车数据集频繁项集挖掘结果
4.4 本章小结
5 基于出租车数据的热点区域推荐
5.1 兴趣点研究概述
5.1.1 兴趣点概念
5.1.2 兴趣点分类
5.2 城市热点区域分析
5.2.1 停留点统计分析
5.2.2 不同兴趣点的停留点统计分析
5.3 热点区域获取与推荐
5.3.1 热点区域获取
5.3.2 热点区域推荐
5.4 本章小结
6 总结与展望
6.1 本文总结
6.2 工作展望
致谢
参考文献
攻读学位期间科研成果
本文编号:3306896
【文章来源】:西安理工大学陕西省
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 国内外研究现状
1.2.2 现存问题及难点
1.3 研究框架及内容
1.3.1 研究框架
1.3.2 研究内容
1.4 本文的组织结构
2 出租车热点区域分析理论及相关技术
2.1 CLIQUE网格聚类
2.1.1 CLIQUE网格聚类算法思想
2.1.2 CLIQUE网格聚类算法过程
2.2 FP-growth算法
2.2.1 FP-growth算法基本思想
2.2.2 FP-growth算法过程
2.3 本章小结
3 基于CLIQUE网格聚类算法的改进
3.1 基于高斯过程的CLIQUE网格算法
3.1.1 相关定义
3.1.2 基于高斯随机分布的CLIQUE网格算法
3.2 改进的高斯随机分布的CLIQUE网格算法
3.2.1 改进动机
3.2.2 相关定义及原理性质
3.2.3 改进思路
3.2.4 改进方法
3.3 实验结果与分析
3.3.1 出租车数据预处理
3.3.2 实验环境
3.3.3 有效性评估
3.3.4 可靠性分析
3.3.5 停留点聚类结果
3.4 本章小结
4 基于并行FP-growth算法的改进
4.1 基于布尔矩阵的并行FP-growth算法
4.1.1 相关定义及原理
4.1.2 BPFP算法原理
4.2 改进的并行FP-growth算法
4.2.1 改进动机
4.2.2 相关定义
4.2.3 改进思路
4.2.4 改进方法
4.3 实验结果与分析
4.3.1 实验环境
4.3.2 串行算法和并行算法的性能对比
4.3.3 三种并行算法性能对比
4.3.4 不同分组策略性能对比
4.3.5 节点变化时基于两种框架的性能对比
4.3.6 出租车数据集频繁项集挖掘结果
4.4 本章小结
5 基于出租车数据的热点区域推荐
5.1 兴趣点研究概述
5.1.1 兴趣点概念
5.1.2 兴趣点分类
5.2 城市热点区域分析
5.2.1 停留点统计分析
5.2.2 不同兴趣点的停留点统计分析
5.3 热点区域获取与推荐
5.3.1 热点区域获取
5.3.2 热点区域推荐
5.4 本章小结
6 总结与展望
6.1 本文总结
6.2 工作展望
致谢
参考文献
攻读学位期间科研成果
本文编号:3306896
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3306896.html