室内移动对象的行为模式挖掘及个性化推荐研究
发布时间:2021-04-12 04:43
据统计,人类在日常生活中有超过80%的时间处在住宅、办公室、商场等室内空间。了解和掌握人群的室内行为模式有助于公共灾害防护、公共设施优化以及室内个性化推荐服务等。近年来,随着室内定位技术与移动智能终端设备的不断发展,采集到的室内移动对象的定位数据和轨迹信息更加精确,为分析室内个体及群体的空间分布、行为模式及偏好信息奠定了数据基础。同时也让基于室内位置的人类行为模式挖掘与应用成为当前GIS研究的热点。本文基于某大型商场的室内客流定位数据,结合商场室内空间的实体特征研究室内WIFI定位数据的预处理方法及轨迹重构方法;结合商场内空间实体的属性信息,研究顾客群体的轨迹聚类,挖掘商场客流的行为模式;针对用户的个性化需求,构建基于轨迹相似度的个性化推荐框架。本文的主要工作与贡献有以下三点:(1)针对室内WIFI定位数据特点与室内复杂的空间结构特征,提出了一种顾及语义的室内数据预处理方法。首先使用启发式滤波方法与滑动窗口算法对WIFI定位数据进行分层与分段滤波处理,用以解决定位点的异常值问题;其次在数据预处理过程中引入位置语义与语义轨迹的概念,将室内定位点转换成语义轨迹序列,便于进一步挖掘室内轨迹信...
【文章来源】:中国矿业大学江苏省 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
HDFS结构模型
2 顾及室内语义信息的轨迹数据预处理方法研究2.5.1 实验环境本实验所使用的机器为华硕 GL552VW 笔记本电脑,运行内存为 8G,处理器为主频为 2.6GHz 的 Intel Core i7,操作系统为 64 位的 Windows10 操作系统,Hadoop 平台的集群由 8 个普通计算机组成,操作系统为 64 位的 CentOS-6.9 操作系统,内存大小共 128G,存储空间为 72T,使用的 hadoop 版本号为 2.7.3,使用的 spark 版本号为 2.1.1。本实验使用的开发工具为 IntelliJ IDEA,开发语言包括 Java 与 Scala,使用的商铺平面图及定位点解析工具为 ArcGis 10.2。实验所需数据存储在 Hadoop 平台中的 HDFS 上,使用 Hive 对其进行索引查询。2.5.2 实验数据本实验所使用的数据是某大型商场内的真实室内移动对象轨迹数据,选取了2018 年 1 月 1 日全天的 WIFI 定位数据,原始数据量为 720 万余条。商铺底图数据包含 11 个楼层,共 306 家商铺。
拆分为多段独立轨迹,拆分后得到的 MacId 为新的独立 MacId。在进行滤波处理之前,需要对移动对象的室内轨迹进行分层处理,由于楼层间存在跳跃点,因此引入了滑动窗口算法,其处理流程如图 2-3 所示,本实验使用 Spark 计算框架进行运算,采用相同的处理逻辑,将单机处理时所需的 1 小时处理时间缩短到 2 分钟内。图 2-3 基于滑动窗口算法的楼层处理流程Figure 2-3 Sliding window algorithm floor processing flow经过该处理方法处理后,原始定位数据的楼层时序变得更符合客观生活规律,大量楼层间的异常定位坐标被重新划分到了合理的楼层内,如图 2-4 与图 2-5 中所示,MacId 为 EC852F56039B 的移动对象的原始楼层时序轨迹与处理后的楼层时序轨迹图可以体现出滑动窗口算法对原始数据的修正有很好的效果。
本文编号:3132642
【文章来源】:中国矿业大学江苏省 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
HDFS结构模型
2 顾及室内语义信息的轨迹数据预处理方法研究2.5.1 实验环境本实验所使用的机器为华硕 GL552VW 笔记本电脑,运行内存为 8G,处理器为主频为 2.6GHz 的 Intel Core i7,操作系统为 64 位的 Windows10 操作系统,Hadoop 平台的集群由 8 个普通计算机组成,操作系统为 64 位的 CentOS-6.9 操作系统,内存大小共 128G,存储空间为 72T,使用的 hadoop 版本号为 2.7.3,使用的 spark 版本号为 2.1.1。本实验使用的开发工具为 IntelliJ IDEA,开发语言包括 Java 与 Scala,使用的商铺平面图及定位点解析工具为 ArcGis 10.2。实验所需数据存储在 Hadoop 平台中的 HDFS 上,使用 Hive 对其进行索引查询。2.5.2 实验数据本实验所使用的数据是某大型商场内的真实室内移动对象轨迹数据,选取了2018 年 1 月 1 日全天的 WIFI 定位数据,原始数据量为 720 万余条。商铺底图数据包含 11 个楼层,共 306 家商铺。
拆分为多段独立轨迹,拆分后得到的 MacId 为新的独立 MacId。在进行滤波处理之前,需要对移动对象的室内轨迹进行分层处理,由于楼层间存在跳跃点,因此引入了滑动窗口算法,其处理流程如图 2-3 所示,本实验使用 Spark 计算框架进行运算,采用相同的处理逻辑,将单机处理时所需的 1 小时处理时间缩短到 2 分钟内。图 2-3 基于滑动窗口算法的楼层处理流程Figure 2-3 Sliding window algorithm floor processing flow经过该处理方法处理后,原始定位数据的楼层时序变得更符合客观生活规律,大量楼层间的异常定位坐标被重新划分到了合理的楼层内,如图 2-4 与图 2-5 中所示,MacId 为 EC852F56039B 的移动对象的原始楼层时序轨迹与处理后的楼层时序轨迹图可以体现出滑动窗口算法对原始数据的修正有很好的效果。
本文编号:3132642
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3132642.html
最近更新
教材专著