当前位置:主页 > 科技论文 > 网络通信论文 >

移动用户时空轨迹预测

发布时间:2020-09-14 20:26
   随着经济社会的高速发展和大数据时代的到来,社会信息化、治安动态化、犯罪智能化、维权政治化、反恐常态化等特征日渐突出,传统的公安警务模式很难适应新形式新任务的要求。面对大数据时代复杂多变的国内外社会环境和挑战,我们需牢固树立大数据思维,创新大数据技术,深化大数据应用。加快治安机制转型升级是公安机关的重大任务和责任。为此,公安局根据市局的统一部署,加快推进公安大数据实战应用建设专项项目,着力打造大数据时代下的公安现代警务机制。此研究起源于本文所在公司上海理想承接公安项目需求所致,公安部提议建立流窜犯罪分子路径预测模型,由于犯罪等数据协调进度较拖沓,因此首先使用电信普通用户为研究对象,对其用户时空轨迹数据提出可行的一般算法框架,再视情况用于具体情境中,体现由演绎到归纳的思想。针对这种情况,本文以运营商基站捕获的手机信令数据,结合外部数据如用户信息、气象数据、中国节假日和商业标签信息等作为数据分析基础,增加百度地图和高德地图API找到每个基站对应的经纬度,整合多源异构数据源以便更好地反映移动用户的时空轨迹全貌,提炼信息较强的特征域,对后期的数据建模工作打下良好的基础。本文在此课题的创新工作在于有以下三种:(一)定位算法优化各种通信场景包括2G,3G和4G,为了覆盖这些场景而进行基站定位,创造性地将这些定位数据OIDD,PCMD和LTE进行融合。并利用基于时延的三角定位算法TDOA,多个基站同时接收信号,根据信号到达时间,计算距各个基站的距离,使误差不超过50米。(二)改善训练模型由于上海电信用户基站位置数据很庞大,如何有效进行模型训练是首要考虑的问题。本文将地理空间网格化,同时增加松驰变量解决边界数据稀疏性问题,模型和超参数选择均可在网格中运行,通过该子集本文可以在较短时间内知道模型的性能。在特征构建过程中加入计数特征,排序特征,特征组合,并在时间离散化的基础上从3个周期捕捉时间特征,有效减少模型误差。(三)模型融合每个单一模型将预测每位用户概率较高十个地标。本文使用默认字典类来组合不同模型的概率,并将前三个较高概率的地标作为预测输出。本文首先在验证集整合,看看模型组合是否具有更好的性能。然后,使用这种组合在整个数据集上运行一个融合,同时测试融合的条件即低相关度是否满足使用,最后将这种融合进行贝叶斯估计加权以便得到更高的模型精度。最终实验结果表明,融合模型比单一模型有更高的精度,单一模型的MAP3分数大约在0.51上下,而融合模型贝叶斯优化模型将达到0.82左右。经多次实验,不断地完善特征工程、组合特征训练模型,超参数调优使这个结果趋于稳定,模型融合的关键在于模型差异性,差异性主要体现在不同模型、相同模型不同参数和训练数据不同。而且每次模型融合之前要参考各个模型的相关性,可以用Cosine余弦相似或者Person系数评价,也可以利用MIC最大信息数来检验,这样才能有效避免过拟合。当然在特征工作和调参方面其实还有很大的改进空间。从目前结果来看,本模型显示了较高的可行性和有效性,将有助于公安机关勘察治安形势、发现治安重心、科学部署警力、评估工作绩效,从而达到辅助决策的最终目标。
【学位单位】:上海交通大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP311.13;TN929.5;D924.3
【部分图文】:

曲线,平滑作用,黑线,权重


的是预测概率。加权平均公式如见 2-1,其中模型的个数由n代表,权重由iWeight 代表,模型i的预测概率值由iP 代表。例如两个模型,林(权重 0.8)和支持向量机(权重 0.2),其预测概率分别为:0.450.55,那么最终的预测概率,(0.8 * 0.45+0.55 * 0.2)/(0.8+0.2)=0.47。 niiiWeightP1*(2-1为了能够使模型减少过拟合现象,取平均值是常用方法。图中所示,代表模型边界,可以看出它几乎拟合了所有点,但黑色线明显有较好能力,虽然它没有拟合所有点,但是减少了噪音数据的影响,以能在上会有更好的表现。也就是说如果从结果取平均的话,那么决策边界黑色曲线靠拢,将具有较好的表达能力,如图 2-2 所示。

基站


图 3-1 LBS 基站定位Fig.3-1 LBS base station positioning限性数据覆盖范围较广,时效性较强,成本低,但也存行动隐私,对未来深入数据挖掘或商业应用产生有率已经相当高,但是低龄儿童及老人未持有手、郊区这些地区,由于基站资源分布不均,手机了手机定位信息的接收[18]。计判系统整体架构研判系统,该架构结构根据实际情况共分成了五据源层,包含 110 接处警等不同格式不同来源的

警情,系统架构


图 3-2 110 警情研判系统架构Fig.3-2 110 Judged SystemArchitecture3.3.2 系统部署架构该系统部署架构如图 3-3 所示,第一虚线围框的服务器是为用户轨迹预测系统布署的服务器,经预计大数据平台可能需增加三台,用于基础定位分析处理;在用户轨迹预测应用平台,可能需要新增服务器八台。

【参考文献】

相关期刊论文 前10条

1 王元;郑贵省;王鹏;;融合交通特性节点度和LISH模型的公路网关键节点辨识方法[J];公路交通科技;2015年10期

2 丁亮;钮心毅;宋小冬;;基于移动定位大数据的城市空间研究进展[J];国际城市规划;2015年04期

3 盖文妹;邓云峰;蒋仲安;李竞;杜焱;;双权重应急交通网络最优路径数学模型及算法研究[J];中南大学学报(自然科学版);2015年06期

4 王劲峰;葛咏;李连发;孟斌;武继磊;柏延臣;杜世宏;廖一兰;胡茂桂;徐成东;;地理学时空数据分析方法[J];地理学报;2014年09期

5 吉根林;赵斌;;面向大数据的时空数据挖掘综述[J];南京师大学报(自然科学版);2014年01期

6 王蕾;邓国臣;郑培蓓;戴晶;崔登吉;;地理空间数据模型的对比研究[J];遥感信息;2013年05期

7 刘瑜;肖昱;高松;康朝贵;王瑶莉;;基于位置感知设备的人类移动研究综述[J];地理与地理信息科学;2011年04期

8 于鹏,常永宇;CDMA移动定位技术及其精度分析[J];电信网技术;2005年09期

9 曹志月,刘岳;一种面向对象的时空数据模型[J];测绘学报;2002年01期

10 李德仁,王树良,史文中,王新洲;论空间数据挖掘和知识发现[J];武汉大学学报(信息科学版);2001年06期

相关硕士学位论文 前4条

1 刘权芳;两类时空数据模型及其应用研究[D];长安大学;2015年

2 李予娇;时空数据模型在人口流动研究中的应用[D];首都经济贸易大学;2012年

3 周巨锁;网络统计地图制图系统的设计与实现[D];武汉大学;2005年

4 吕志慧;地理信息三维可视化系统应用研究[D];郑州大学;2002年



本文编号:2818607

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2818607.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c7dcf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com