基于轨迹数据的用户行为分析方法研究

发布时间:2021-04-22 14:57
  随着互联网行业的高速发展,数据量变得越来越大,进入了大数据时代。庞大的数据集中蕴含着大量的信息,这些信息可以通过数据挖掘与数据处理来发现。轨迹数据作为大数据的一个组成部分,其主要组成部分如下:经纬度信息、时间、以及其他的一些基本信息。本文以电动自行车轨迹数据为实验对象来对轨迹数据进行分析与研究,由于该数据中隐藏着大量的用户行为特征,如:用户生活规律、出行习惯、以及频繁路径等,故本文对电动自行车轨迹数据进行深入研究从而挖掘用户的行为特征。具体贡献如下:本文利用轨迹点间的相关性对传统停留点挖掘算法进行改进,通过该算法提取轨迹中的停留点,从而挖掘出用户住居住地信息。由于停留点处轨迹具有方向变化多样的特性,所以本文选用皮尔逊相关系数来计算轨迹数据间的相关性。首先根据轨迹坐标间的相关系数来提取候选停留点;接着通过设置距离与时间的阈值来对候选停留点进行筛选,来提取停留点区域,同时利用最小包围矩形对停留点附近区域进行判断识别,提高识别区域的准确度。本文利用kd-tree对快速搜索与查找的密度聚类算法进行改进(简称KDFDP算法)。并利用该算法挖掘出用户的居住地信息,得出结果利用百度API进行可视化;... 

【文章来源】:沈阳理工大学辽宁省

【文章页数】:67 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 课题研究的背景和意义
    1.2 国内外研究现状
        1.2.1 轨迹数据的研究现状
        1.2.2 聚类分析的研究现状
        1.2.3 基于轨迹数据的用户行为分析研究现状
    1.3 本文工作和章节安排
    1.4 本章小结
第2章 轨迹数据相关理论与技术
    2.1 轨迹数据概述
    2.2 常用公式
        2.2.1 距离度量公式
        2.2.2 相关性公式
    2.3 轨迹数据分析常用聚类算法
        2.3.1 DBSCAN聚类算法
        2.3.2 基于密度的快速搜索与查找聚类算法
        2.3.3 聚类算法评价方法
    2.4 本章小结
第3章 电动自行车轨迹数据处理
    3.1 数据特征分析
        3.1.1 轨迹数据信息
        3.1.2 轨迹数据特征
    3.2 数据处理
        3.2.1 数据清洗
        3.2.2 停留点挖掘
        3.2.3 轨迹数据切割
        3.2.4 数据处理算法复杂度
    3.3 本章小结
第4章 基于轨迹数据点的用户行为分析
    4.1 kd-tree
        4.1.1 kd-tree的数据结构
        4.1.2 kd-tree建树算法分析
        4.1.3 建树算法描述
        4.1.4 选择分割维度
        4.1.5 选择分割点
    4.2 KDFDP聚类算法
    4.3 用户居住地挖掘
        4.3.1 基于聚类算法的居住地挖掘
        4.3.2 实验与结果分析
    4.4 用户行驶速度分析
        4.4.1 日程速度行为建模
        4.4.2 基于日程速度行为的用户聚类分析
        4.4.3 实验与结果分析
    4.5 本章小结
第5章 基于轨迹数据轨迹的用户行为分析
    5.1 轨迹分段
    5.2 轨迹聚类
        5.2.1 距离度量公式
        5.2.2 子轨迹的DBSCAN聚类算法
    5.3 特征轨迹提取
    5.4 实验结果与分析
    5.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文和获得的科研结果
致谢


【参考文献】:
期刊论文
[1]Hadoop平台下粒子滤波结合改进ABC算法的IoT大数据特征选择方法[J]. 吴颖,李晓玲,唐晶磊.  计算机应用研究. 2019(11)
[2]出租车轨迹数据挖掘进展[J]. 吴华意,黄蕊,游兰,向隆刚.  测绘学报. 2019(11)
[3]融合多尺度边缘检测的小波贝叶斯SAR图像滤波[J]. 余祥伟,薛东剑,陈凤娇.  遥感信息. 2019(05)
[4]多特征融合的句子语义相似度计算方法[J]. 翟社平,李兆兆,段宏宇,李婧,董迪迪.  计算机工程与设计. 2019(10)
[5]基于改进HMM模型的3D景区地图匹配算法[J]. 黄娟娟,徐圆,朱群雄.  计算机工程. 2019(06)
[6]瞳孔中心点自动定位与对准装置[J]. 王晶,高峰,李婉越,史国华.  光学精密工程. 2019(06)
[7]基于轨迹聚类的天光光谱特征分析[J]. 蔡江辉,杨雨晴,杨海峰,罗阿理,孔啸,张继福.  光谱学与光谱分析. 2019(04)
[8]基于语义轨迹停留点的位置服务匹配与应用研究[J]. 齐凌艳,陈荣国,温馨.  地球信息科学学报. 2014(05)
[9]基于二分K-均值的SVM决策树自适应分类方法[J]. 裘国永,张娇.  计算机应用研究. 2012(10)
[10]基于速度约束的分段轨迹聚类算法[J]. 韩陈寿,夏士雄,张磊,朱长成.  计算机工程. 2011(07)

博士论文
[1]电动自行车风险驾驶行为及事故机理研究[D]. 王涛.东南大学 2017
[2]鸽子位置细胞功能网络对目标导向行为的信息编码机制[D]. 刘新玉.郑州大学 2017
[3]基于运动特征的轨迹相似性度量研究[D]. 朱进.南京师范大学 2015

硕士论文
[1]基于车辆轨迹数据的用户行为分析研究[D]. 刘睿晗.中国科学院大学(中国科学院深圳先进技术研究院) 2019
[2]基于近邻相似图的谱聚类算法研究与应用[D]. 刘友超.江南大学 2019
[3]出租车GPS数据的信息挖掘研究[D]. 陈玲燕.北京交通大学 2018
[4]液压元件制造数字化车间生产调度信息系统研究[D]. 陈太湖.合肥工业大学 2018
[5]面向特定目标的行人轨迹分析系统设计与实现[D]. 李艳.电子科技大学 2018
[6]基于移动通信数据信息挖掘技术的研究与应用[D]. 王陆.北京邮电大学 2018
[7]基于出租车GPS数据的居民出行时空规律和出行热点区域研究[D]. 陈红丽.云南大学 2016
[8]电动自行车交通现状问题及对策研究[D]. 陈喆罕.云南大学 2012



本文编号:3153974

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3153974.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aa04c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com