移动对象轨迹序列模式挖掘
本文关键词:移动对象轨迹序列模式挖掘
更多相关文章: 移动对象 数据表示 时间序列 模式挖掘 特征表示 模式匹配 移动行为预测
【摘要】:随着全球定位系统(Global Positioning System,简称GPS)越来越普遍地运用,考虑到对移动对象(Moving Object)进行定位跟踪,通过GPS获取到移动对象的活动轨迹,并对轨迹序列进行分析研究具有潜在的重大价值。序列模式挖掘(Sequence Pattern Mining)作为数据挖掘的一种重要方法,备受关注。本文实验采用的数据集来自2008年五月的美国旧金山出租车移动数据,主要分布在旧金山湾地区,共包含536辆出租车的GPS坐标数据。(1)作为包含时间和空间两个方面的移动轨迹信息,GPS采集的数据具有数据量大、周期性、噪声干扰严重、缺失性等特点,如何对轨迹数据进行有效地预处理并得到有用的数据,将会直接影响到序列模式挖掘与匹配预测的正确性。本文从数据插值、数据聚类、数据归一化、数据特征表示以及灰色关联分析等方面对数据进行处理,并通过对GPS轨迹停留点的检测与合并方法对轨迹点进行优化,使数据能够高效的进行特征提取,为后续算法提高可靠的轨迹序列。(2)面对基于Apriori算法基本思想的AprioriAll算法、GSP算法以及SPADE算法等以及基于模式增长的算法,包括Freespan算法、Prefixspan算法等,通过对几种算法进行对比分析,本文吸取了模式增长方式不产生候选序列的优点,同时通过对候选序列更加有效地剪枝进行算法优化,有效地提高了模式挖掘算法的效率以及正确性。(3)面对序列模式匹配不准确这一难题,本文提出了FreSeqMatching匹配算法,利用提出的序列类、序列焦点的定义,结合相似度分析的概念,通过对匹配效果及时反馈以及支持度等条件进行及时调整,结合模式挖掘算法,有效地提高了序列模式匹配的精度以及移动对象轨迹预测的准确率。
【关键词】:移动对象 数据表示 时间序列 模式挖掘 特征表示 模式匹配 移动行为预测
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-5
- Abstract5-10
- 注释表10-11
- 缩略词11-13
- 第一章 绪论13-22
- 1.1 研究背景及意义13-14
- 1.2 国内外研究现状14-20
- 1.2.1 移动对象轨迹研究现状15-16
- 1.2.2 序列模式挖掘研究现状16-20
- 1.3 本文研究内容及组织结构20-22
- 第二章 序列模式挖掘相关技术22-37
- 2.1 特征表示22-25
- 2.1.1 频域表示方法23
- 2.1.2 符号化表示方法23-24
- 2.1.3 奇异值分解表示法24
- 2.1.4 分段线性表示法24-25
- 2.2 相似度分析25-27
- 2.2.1 抽取最长公共子序列25-27
- 2.2.2 两个轨迹模式间的相似度27
- 2.3 序列模式挖掘27-35
- 2.3.1 基本概念27-29
- 2.3.2 Prefix Span算法描述29-33
- 2.3.3 相关算法比较33-35
- 2.4 本章小结35-37
- 第三章 移动对象轨迹数据预处理37-52
- 3.1 移动对象数据说明37-40
- 3.2 数据预处理分析40-47
- 3.2.1 数据插值41-42
- 3.2.2 数据归一化42-43
- 3.2.3 数据聚类43-44
- 3.2.4 灰色关联度分析44-47
- 3.3 GPS停留点处理47-50
- 3.3.1 基本概念47-48
- 3.3.2 停留点检测48-49
- 3.3.3 停留点合并49-50
- 3.4 参数选择50
- 3.5 本章小结50-52
- 第四章 移动对象轨迹序列模式挖掘算法研究52-68
- 4.1 数据处理方法的选择52-53
- 4.1.1 问题描述52
- 4.1.2 解决方案52-53
- 4.2 序列模式挖掘算法分析53-57
- 4.2.1 问题描述53-55
- 4.2.2 改进后Prefix Span算法分析55-57
- 4.3 序列模式匹配过程分析57-62
- 4.3.1 问题描述57-59
- 4.3.2 Fre Seq Matching算法分析59-62
- 4.4 实验分析62-66
- 4.4.1 实验结果描述62
- 4.4.2 改进匹配算法之后的实验结果分析62-64
- 4.4.3 总体改进后的实验结果分析64-66
- 4.5 本章小结66-68
- 第五章 总结与展望68-70
- 5.1 本文总结68
- 5.2 展望68-70
- 参考文献70-75
- 致谢75-77
- 在学期间的研究成果及发表的学术论文77
【相似文献】
中国期刊全文数据库 前10条
1 张长海;胡孔法;陈凌;;序列模式挖掘算法综述[J];扬州大学学报(自然科学版);2007年01期
2 肖哲;任胜兵;;序列模式挖掘研究进展[J];科技信息(科学教研);2007年36期
3 陈卓;杨炳儒;宋威;宋泽锋;;序列模式挖掘综述[J];计算机应用研究;2008年07期
4 王虎;丁世飞;;序列模式挖掘研究与发展[J];计算机科学;2009年12期
5 陈晓;;一种模糊序列模式挖掘的有效方法[J];现代计算机(专业版);2010年13期
6 李乃乾;姚新会;田东平;;多时间粒度序列模式挖掘[J];小型微型计算机系统;2011年01期
7 吴孔玲;缪裕青;苏杰;张晓华;;序列模式挖掘研究[J];计算机系统应用;2012年06期
8 聂成林,王浩,胡学钢;基于概念格的序列模式挖掘[J];计算机工程;2003年20期
9 龚惠群,黄超,彭江平;具有双时间维约束的股票序列模式挖掘[J];计算机工程;2003年20期
10 许兆新,郝燕玲;约束在序列模式挖掘中的应用研究[J];计算机工程与应用;2004年05期
中国重要会议论文全文数据库 前10条
1 吕静;陈未如;刘俊;Osei Adjei;;并发分支模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 端义锋;胡谷雨;丁力;;序列模式挖掘在网络告警分析中的应用[A];2004年全国通信软件学术会议论文集[C];2004年
3 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
9 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 张锐;熊峗;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国博士学位论文全文数据库 前8条
1 张劲松;基于约束的序列模式挖掘及其应用研究[D];上海交通大学;2015年
2 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
3 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年
4 熊峗;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
5 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
6 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
7 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
8 徐前方;基于数据挖掘的网络故障告警相关性研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 张长海;分布式序列模式挖掘算法研究[D];扬州大学;2008年
2 陈晓;基于模糊集的序列模式挖掘研究[D];天津大学;2007年
3 俞单庆;序列模式挖掘及其在入侵检测中的应用研究[D];南京师范大学;2008年
4 杨名时;加权负序列模式挖掘算法研究[D];齐鲁工业大学;2015年
5 周慧霞;回归方法估算最长频繁模式长度研究[D];河北工业大学;2015年
6 冯建;基于命题逻辑的频繁序列模式挖掘算法的研究[D];浙江工业大学;2014年
7 廖清科;面向时间序列相似性的序列模式挖掘及应用[D];重庆交通大学;2015年
8 周坤;一般周期间隙约束的序列模式挖掘[D];河北工业大学;2015年
9 向剑平;Web日志中序列模式挖掘算法的研究[D];重庆大学;2015年
10 董鑫;时序数据序列模式挖掘[D];南京航空航天大学;2015年
,本文编号:1017089
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1017089.html