基于轨迹数据的高校用户相似性研究及应用
发布时间:2021-01-06 17:15
聚类和推荐系统的应用需要用户相似性这一参数,目前有多种方法度量用户的相似性,基于轨迹数据的方法是其中重要方法之一。随着位置获取技术的日益普及,例如GPS和Wi-Fi,大量的用户轨迹数据被获取,这使得该方法成为当前研究的热点。目前,大部分基于轨迹的用户相似性研究主要应用在社区网络领域,在物理世界的应用鲜见报道。校园网由于其用户的渗透性和多样性,是研究无线局域网用户行为模式的良好平台。在上述背景下,本文基于高校场景采集的用户轨迹数据,针对聚类和推荐系统应用提出了两种用户相似性度量方法。本文主要工作如下:分析并总结了基于轨迹的用户相似性的研究现状,介绍了基于轨迹的相似性度量的常见方法以及聚类技术、推荐系统技术。介绍基于真实高校场景下采集的轨迹数据集,并给出轨迹数据预处理的步骤,包括数据清理、数据集成、数据转换。此外,对数据集从多维度挖掘,为后续研究提供了数据支撑。基于L2范数归一化Euclid距离(2NN-Euclid距离)的用户相似性研究。利用用户出现的地点及持续时间构建特征向量,提出了2NN-Euclid距离,并基于该距离对用户相似性进行了研究。通过用户聚类结果评判相似性度量的优劣,实验...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
Wi-Fi探针部署地点分布
2017-09-15 22:40:00 14 b0e235c0398a, 2400bae82eb72017-09-15 22:41:00 14 b0e235c0398a为了更好的进行高校用户相似性分析,本文选取 9 月 11 日至 11 月 11 日这两个月数据异变小、质量较高的进行分析。在此时间段内,共捕获到 580000 余个不同 MAC 地址,这些 MAC 地址包含了校内教师、研究生、本科生、保卫人员,以及校外人员等不同用户类型。要注意的是,后续进行的数据分析并不是利用此处所有的数据,而是首先进行预处理以保证数据的准确性和有效性。3.2 数据预处理通过 Wi-Fi 探针捕获的 MAC 数据可能包含“脏数据”,数据预处理是解决此类问题的可靠方法。图 3-2 给出了数据预处理的整体流程,数据在预处理过程中经历了一系列步骤:
华 中 科 技 大 学 硕 士 学 位 论 文数据清理清理是通过填写缺失值、平滑噪声数据或解决数据中的不一致等通过 Wi-Fi 探针捕获的数据中,存在异常 MAC,数据预处理的第值。C 地址是分配给网络接口控制器(NIC)的唯一标识符,用于在网行通信。硬件的无线网卡必须具有唯一的 MAC 地址,图 3-3 给出构。
【参考文献】:
期刊论文
[1]基于惯性传感器的行人室内定位算法研究[J]. 贾浩男,贾瑞才,王博远. 无线电工程. 2018(08)
[2]基于用户轨迹数据的移动推荐系统研究[J]. 孟祥武,李瑞昌,张玉洁,纪威宇. 软件学报. 2018(10)
[3]基于改进LCSS的移动用户轨迹相似性查询算法研究[J]. 陈少权. 移动通信. 2017(06)
硕士论文
[1]无线网络环境下用户行为的社会性分析[D]. 吴利兵.上海交通大学 2012
本文编号:2960949
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
Wi-Fi探针部署地点分布
2017-09-15 22:40:00 14 b0e235c0398a, 2400bae82eb72017-09-15 22:41:00 14 b0e235c0398a为了更好的进行高校用户相似性分析,本文选取 9 月 11 日至 11 月 11 日这两个月数据异变小、质量较高的进行分析。在此时间段内,共捕获到 580000 余个不同 MAC 地址,这些 MAC 地址包含了校内教师、研究生、本科生、保卫人员,以及校外人员等不同用户类型。要注意的是,后续进行的数据分析并不是利用此处所有的数据,而是首先进行预处理以保证数据的准确性和有效性。3.2 数据预处理通过 Wi-Fi 探针捕获的 MAC 数据可能包含“脏数据”,数据预处理是解决此类问题的可靠方法。图 3-2 给出了数据预处理的整体流程,数据在预处理过程中经历了一系列步骤:
华 中 科 技 大 学 硕 士 学 位 论 文数据清理清理是通过填写缺失值、平滑噪声数据或解决数据中的不一致等通过 Wi-Fi 探针捕获的数据中,存在异常 MAC,数据预处理的第值。C 地址是分配给网络接口控制器(NIC)的唯一标识符,用于在网行通信。硬件的无线网卡必须具有唯一的 MAC 地址,图 3-3 给出构。
【参考文献】:
期刊论文
[1]基于惯性传感器的行人室内定位算法研究[J]. 贾浩男,贾瑞才,王博远. 无线电工程. 2018(08)
[2]基于用户轨迹数据的移动推荐系统研究[J]. 孟祥武,李瑞昌,张玉洁,纪威宇. 软件学报. 2018(10)
[3]基于改进LCSS的移动用户轨迹相似性查询算法研究[J]. 陈少权. 移动通信. 2017(06)
硕士论文
[1]无线网络环境下用户行为的社会性分析[D]. 吴利兵.上海交通大学 2012
本文编号:2960949
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2960949.html