面向旅游场景的时空大数据应用服务技术的优化与实现
发布时间:2021-02-01 01:45
时空大数据即是拥有时间和空间两个维度属性的大数据,在海量的大数据中,80%以上的数据都和时间、空间位置有关。在时空大数据的应用领域之中,旅游行业的前景非常广阔,借助时空大数据相关技术平台,可以方便旅行社团队跟踪监测;可以制作景区客流热力图,方便景区管理人员实时负荷监测;可以准确预知客流趋向,进而采取相应的措施疏导客流等等。本文以旅游智慧监管平台为背景,研究时空大数据中一些关键性技术的优化问题,主要涉及时空采集性能优化、分布式存储方案设计以及基于移动对象的最近邻查询优化三个方面。首先,本文针对旅游客流数据的采集性能提升问题,设计了一种基于大数据平台的读写框架STClient,先介绍了其整体流程,然后针对时空数据的特点,分别从文件读写、数据预处理、时空索引方案设计、序列化以及入库这个五个方面进行优化。然后,本文设计了一种面向时空大数据的分布式存储系统。根据时空大数据的空间性和时序性特点,设计了基于项目背景的系统架构;按照时空划分对数据进行,并通过构建空间热度树来提高系统负载均衡的性能;在已有数据冷热分离方案的基础上针对其问题做出了进一步改进,完善存储系统的可用性和提高系统的性能。这些方案使...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:92 页
【学位级别】:硕士
【部分图文】:
基于时空大数据的旅游景区客流监管示意图
第二章相关理论和技术15表2-5Base32编码Decimal0123456789101112131415Base320123456789bcdefgDecimal16171819202122232425262728293031Base32hjkmnpqrstuvwxyz根据上述步骤,GeoHash最终将二维的经纬度坐标转转换成了GeoHash地理编码字符串,比如图2-3展示了北京9个区域的GeoHash字符串,每一个字符串代表着一个矩形区域,同时,该区域内的所有点(即经纬度坐标)都共享相同的GeoHash字符串,这样既可以保护隐私(只表示大概区域位置而不是具体的点),又比较容易做缓存。图2-3北京9个区域的GeoHash字符串Geohash的优点很明显,它利用Z阶曲线进行编码。而Z阶曲线可以将二维或者多维空间里的所有点都转换成一维曲线。在数学上成为分形维。并且Z阶曲线还具有局部保序性。Z阶曲线通过交织点的坐标值的二进制表示来简单地计算多维度中的点的z值。一旦将数据被加到该排序中,任何一维数据结构,例如二叉搜索树,B树,跳跃表或(具有低有效位被截断)哈希表都可以用来处理数据。通过Z阶曲线所得到的顺序可以等同地被描述为从四叉树的深度优先遍历得到的顺序。这也是Geohash的另外一个优点,搜索查找邻近点比较快。然而Geohash的缺点之一也来自Z阶曲线。Z阶曲线有一个比较严重的问题,虽然有局部保序性,但是它也有突变性。在每个Z字母的拐角,都有可能出现顺序的突变。Geohash的另外一个缺点是,如果选择不好合适的网格大小,判断邻近点可能会比较麻烦。
电子科技大学硕士学位论文162.2.2GoogleS2S2算法基于希尔伯特(Hilbert)曲线,它将三维的地球转变成二维,再将二维转成一维,最后,将一维表示成二进制码存储,通过这种方式来唯一的表示地球上的一块空间。地球是一个三维的球体,我们只要把这个球体放在一个正方体中,想象从地球的中心向外发光,地球表面的点会投射在正方体上,地球表面就变成如图2-4所示的正方体。然后就可以用0-5这6个数字来标记每一面,通过这个方法将三维变成二维。图2-4S2将三维转变成二维上面的方法实际上会产生一个问题:投射区间比例不同。在图2-5中可以看到,虽然投出的角度数相同,但上方投出的区间却远大于下方。投射范围会出现中间短两边长的问题。如果投射范围不一样,不同区块的面积会差很多。图2-5三维球体映射成二维解决方法是加入区间转换。在得到第一步投射之后,再进行二次变换,将上面长的拉短、将下面短的拉长,尽量让区间变相同。通过上述将地球的表明转换成了二维空间的平面,接下来需要切割二维空间,可以切割出很多正方形,最简单的表示这些正方形的方法是在平面上进行遍历。每遍历到一个点,就给它标注一个值,比如00、01、10、11,随着二进制数字增加,
【参考文献】:
期刊论文
[1]时空大数据及其在智慧城市中的应用[J]. 张拥军. 中国标准化. 2019(16)
[2]基于空间数据内容的动态负载均衡方法[J]. 李忠民,喻占武,朱莉. 武汉大学学报(信息科学版). 2009(05)
硕士论文
[1]基于用户体验的智能终端流畅度评测研究与实现[D]. 尤增显.北京邮电大学 2018
[2]基于HBase的海量数据实时查询系统设计与实现[D]. 卓海艺.北京邮电大学 2013
本文编号:3011970
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:92 页
【学位级别】:硕士
【部分图文】:
基于时空大数据的旅游景区客流监管示意图
第二章相关理论和技术15表2-5Base32编码Decimal0123456789101112131415Base320123456789bcdefgDecimal16171819202122232425262728293031Base32hjkmnpqrstuvwxyz根据上述步骤,GeoHash最终将二维的经纬度坐标转转换成了GeoHash地理编码字符串,比如图2-3展示了北京9个区域的GeoHash字符串,每一个字符串代表着一个矩形区域,同时,该区域内的所有点(即经纬度坐标)都共享相同的GeoHash字符串,这样既可以保护隐私(只表示大概区域位置而不是具体的点),又比较容易做缓存。图2-3北京9个区域的GeoHash字符串Geohash的优点很明显,它利用Z阶曲线进行编码。而Z阶曲线可以将二维或者多维空间里的所有点都转换成一维曲线。在数学上成为分形维。并且Z阶曲线还具有局部保序性。Z阶曲线通过交织点的坐标值的二进制表示来简单地计算多维度中的点的z值。一旦将数据被加到该排序中,任何一维数据结构,例如二叉搜索树,B树,跳跃表或(具有低有效位被截断)哈希表都可以用来处理数据。通过Z阶曲线所得到的顺序可以等同地被描述为从四叉树的深度优先遍历得到的顺序。这也是Geohash的另外一个优点,搜索查找邻近点比较快。然而Geohash的缺点之一也来自Z阶曲线。Z阶曲线有一个比较严重的问题,虽然有局部保序性,但是它也有突变性。在每个Z字母的拐角,都有可能出现顺序的突变。Geohash的另外一个缺点是,如果选择不好合适的网格大小,判断邻近点可能会比较麻烦。
电子科技大学硕士学位论文162.2.2GoogleS2S2算法基于希尔伯特(Hilbert)曲线,它将三维的地球转变成二维,再将二维转成一维,最后,将一维表示成二进制码存储,通过这种方式来唯一的表示地球上的一块空间。地球是一个三维的球体,我们只要把这个球体放在一个正方体中,想象从地球的中心向外发光,地球表面的点会投射在正方体上,地球表面就变成如图2-4所示的正方体。然后就可以用0-5这6个数字来标记每一面,通过这个方法将三维变成二维。图2-4S2将三维转变成二维上面的方法实际上会产生一个问题:投射区间比例不同。在图2-5中可以看到,虽然投出的角度数相同,但上方投出的区间却远大于下方。投射范围会出现中间短两边长的问题。如果投射范围不一样,不同区块的面积会差很多。图2-5三维球体映射成二维解决方法是加入区间转换。在得到第一步投射之后,再进行二次变换,将上面长的拉短、将下面短的拉长,尽量让区间变相同。通过上述将地球的表明转换成了二维空间的平面,接下来需要切割二维空间,可以切割出很多正方形,最简单的表示这些正方形的方法是在平面上进行遍历。每遍历到一个点,就给它标注一个值,比如00、01、10、11,随着二进制数字增加,
【参考文献】:
期刊论文
[1]时空大数据及其在智慧城市中的应用[J]. 张拥军. 中国标准化. 2019(16)
[2]基于空间数据内容的动态负载均衡方法[J]. 李忠民,喻占武,朱莉. 武汉大学学报(信息科学版). 2009(05)
硕士论文
[1]基于用户体验的智能终端流畅度评测研究与实现[D]. 尤增显.北京邮电大学 2018
[2]基于HBase的海量数据实时查询系统设计与实现[D]. 卓海艺.北京邮电大学 2013
本文编号:3011970
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3011970.html
最近更新
教材专著