基于签到数据的用户行为轨迹相似度分析
发布时间:2017-08-09 16:04
本文关键词:基于签到数据的用户行为轨迹相似度分析
更多相关文章: 用户行为轨迹 签到数据 相似度度量 兴趣区域
【摘要】:时空轨迹是移动对象的位置和时间的记录序列,作为一种重要的时空对象数据类型和信息源,时空轨迹的应用范围涵盖了用户行为、智能交通和精准营销等诸多方面。随着卫星定位技术、无线通信、智能终端以及移动互联网的快速发展,人们能够更方便地获取时空轨迹数据。通过对各种时空轨迹数据的分析,我们可以提取时空轨迹数据中的相似性特征,在没有先验知识的情况下,将具有相似行为的时空对象划分到一起,而将具有相异行为的时空对象划分开来,其关键是根据时空轨迹数据的特点,设计与定义不同时空轨迹间的相似度度量方法。本论文主要研究内容包括:由于在位置服务的社交网络中,用户仅在到达某位置后才签到,没有对用户的行为轨迹进行持续的跟踪,用户签到行为具有一定的随意性和重复性,造成在不同位置上签到次数差异较大,少数用户完成了大多数签到,一些位置很少被签到,时间维的不等长使得用户签到数据呈现出稀疏性。本文通过把签到时间划分成几个时间段,采用Optics算法对用户签到兴趣点进行基于密度的分层聚类,得到不同时间段、不同空间划分尺度下的用户兴趣区域,比采用网格或者单一空间划分尺度建立用户轨迹更合理,更能反映用户时空数据的分布情况。同时,采用类似包围盒的思想来比较各个兴趣区域的相似性,更加符合签到数据的特点,大大降低了计算的复杂度,计算效率也得到提高。除此之外,从时间维度对时空轨迹进行的划分,可以根据具体应用,调整各个时间段的权值,从而体现签到数据在各个时间段上的重要程度的不同。最后,本文采用了大型位置社交网络Gowalla中的用户签到数据,通过准确率、召回率等指标对实验结果进行了评价。
【关键词】:用户行为轨迹 签到数据 相似度度量 兴趣区域
【学位授予单位】:西华大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.09;TP311.13
【目录】:
- 摘要4-5
- Abstract5-8
- 1 绪论8-13
- 1.1 研究背景及意义8-9
- 1.2 国内外研究现状及问题9-11
- 1.3 论文主要内容11-12
- 1.4 论文结构安排12-13
- 2 相关基础介绍13-19
- 2.1 基于位置的社交网络相关介绍13-15
- 2.1.1 基于位置的社交网络的特征13-15
- 2.1.2 用户签到数据的行为分析15
- 2.2 聚类方法简介15-16
- 2.3 相似度度量方法介绍16-18
- 2.3.1 余弦相似度16-17
- 2.3.2 欧式距离相似度17
- 2.3.3 Jaccard相似系数17
- 2.3.4 调整的余弦的相似度17-18
- 2.4 本章小结18-19
- 3 基于签到数据的用户行为轨迹相似度分析19-32
- 3.1 有关的用户行为轨迹相似度方法介绍19-21
- 3.2 获取用户签到数据21
- 3.3 用户签到数据预处理21
- 3.4 用户兴趣区域的划分21-27
- 3.4.1 基本术语21-22
- 3.4.2 Optics聚类算法22-26
- 3.4.3 划分ROI26-27
- 3.5 相似区域数SimNumOfROI的计算27-29
- 3.6 用户相似度的计算29-31
- 3.6.1 单层相似度计算29-30
- 3.6.2 跨层相似度计算30-31
- 3.7 本章小结31-32
- 4 分布式计算平台Hadoop32-38
- 4.1 Hadoop介绍32-33
- 4.2 HDFS分布式文件系统介绍33-34
- 4.3 MapReduce思想34-35
- 4.4 用户行为轨迹相似度分析的MapReduce的实现方案35-38
- 5 实验分析38-51
- 5.1 实验数据介绍38
- 5.2 实验过程38-42
- 5.2.1 T个时间段的划分38-41
- 5.2.2 Optics算法分层41-42
- 5.3 方法评价42-50
- 5.3.1 评价指标的介绍42-43
- 5.3.2 相似度分析评价结果43-50
- 5.4 本章小结50-51
- 总结与展望51-52
- 参考文献52-56
- 攻读硕士学位期间发表论文及科研成果56-57
- 致谢57-58
【相似文献】
中国期刊全文数据库 前2条
1 陶闯;;LBS市场发展趋势和挑战[J];卫星与网络;2012年10期
2 ;[J];;年期
中国重要报纸全文数据库 前2条
1 赵朕(中国解放区文学研究会副会长);单纯的绿色 复杂的折光[N];中国纪检监察报;2001年
2 任正虎;抓好团以上党委书记队伍建设[N];解放军报;2003年
中国硕士学位论文全文数据库 前5条
1 冯琳耀;基于室内传感网数据的行为轨迹几何代数建模与特征分析方法[D];南京师范大学;2015年
2 赵方旭;不同水力条件下鱼类个体行为轨迹特性研究[D];广西大学;2016年
3 周永;基于签到数据的用户行为轨迹相似度分析[D];西华大学;2016年
4 王彬;用户行为轨迹聚类及其应用研究[D];西华大学;2016年
5 韩金娥;基于化简行为轨迹的软件可信性评价模型[D];河北大学;2011年
,本文编号:646106
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/646106.html