当前位置:主页 > 科技论文 > 数学论文 >

一种基于信息量的时空深度扫描模型

发布时间:2021-08-22 07:37
  空间或时空扫描模型中,会产生大量有重复性的集群,现有研究方法会按Satscan层次结构删除此类集群,或者用似然比加权集群分析,在整个过程很难量化分析删除后剩下的集群或是加权后的集群是否就能提供更多有意义的信息,缺乏系统评估理论,这将会混淆风险区域的判断.基于此问题本文提出一种基于信息量的时空深度扫描模型IN-scan model,用于对上述重复集群进行处理,所提方法从信息量的角度出发量化每一个扫描集群.方法中引入了信息量,并使用显著统计量和基尼系数来进行扫描风险区域分析.文中使用所提方法与Satscan最新方法(LR-scan model)预警结果进行对比,所提方法 F-Score性能评估值提升10%以上,实验证明该方法较现时空扫描模型有一定优势. 

【文章来源】:小型微型计算机系统. 2020,41(09)北大核心CSCD

【文章页数】:7 页

【部分图文】:

一种基于信息量的时空深度扫描模型


基于信息量的时空深度扫描模型结构

分布图,均值,分布图,扫描区域


地点B和C与A分析一致.这样计算完成后相当于把cluster1、cluster2、cluster3的信息映射到扫描区域L中,二次扫描时只用分析L中的数据即可,见方法介绍模块.3.2 基于事件均值计算的基尼系数

洛伦兹曲线,基尼系数


基尼系数[22]是洛伦兹曲线的一个度量值,洛伦兹曲线[23]主要用于经济领域,如图3所示基尼系数G=S1/(S1+S2),G越大说明收入分配越不平等.Han和Junhee首次将G用于时空扫描模型中,其横纵轴分别表示观察到案例的累加百分比和预期案例的累积百分比,G=0时,即说明该集群无显著性,而G越大,对应扫描域的置信度(1-p)越大,Han使用G是为了报告出更有意义的集群,在我们的研究模型中,研究G亦是为了报告出能提供更多信息量I的集群.在对IN-scan model模型的研分析中,由于我们使用的是均值数据,地点i观察案件数n′i与预测案件数μ′i能综合反映点的风险度,此时地点i与地点j信息相对独立,所以在扫描区域L中进行二次扫描时,测试统计值信息量I(p,G)中的G我们使用扫描域内的n′从小到大排序后计算得到,见图3,假设扫描域为table1中的cluster3,扫描时间为1天,此时若n′c>n′B>n′A,见图4中t=1的G显示图,图中阴影部分占下三角的面积百分比即为G值,t=2和t=3类似分析,从图3中可看出就基尼系数来说,cluster3扫描时间为1天时G较大.在IN-scan model中,结合p与G值计算各条件下的集群的信息量,报告I最大的集群.


本文编号:3357307

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/3357307.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5ad66***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com