大数据背景下基于过滤式-包裹式方法的高危人员风险预警
发布时间:2024-03-22 20:15
对高危人员的犯罪风险评估是主动式警务中一项重点和核心的工作。如何基于大数据技术构建高危人员犯罪分析评估模型是其中的研究重点与难点。针对高危人员犯罪风险评估模型中的高维特征选择问题,本文设计了结合过滤式(Filter)与包裹式(Wrapper)方法的两阶段特征选择方法框架。在第一阶段Filter方法中,本文分别使用卡方检验值与KS检验值作为离散型与连续型属性的筛选指标选择了候选特征集。在第二阶段Wrapper方法中,本文设计了基于随机森林的序列后向特征选择方法进一步优选了特征集。本文使用了某地的吸毒人员数据进行了实证分析以验证方法的有效性。实验结果表明本文的方法可以有效地从高维特征集中选择出较优的特征子集,并且有较快的计算效率和良好的可解释性。
【文章页数】:8 页
【部分图文】:
本文编号:3934903
【文章页数】:8 页
【部分图文】:
图1两阶段式特征选择方法框架
apper方法的详情。第三部分使用了某地的数据进行了实证分析以验证方法的有效性,最后对全文进行总结与展望。二、Filter-Wrapper两阶段特征选择法方法1.两阶段特征选择方法框架本文采用的是结合Filter与Wrapper方法的两阶段特征选择方法。首先以经典的Filter法....
图2经验分布函数曲线示意图
检验值或p值阈值(大于假设检验值阈值或小于p值阈值的候选属性为对目标属性有解释性的属性);4)筛选满足阈值条件的候选属性作为特征选择的结果。(2)基于KS检验的连续型属性特征选择针对属性X是连续型和Y是离散型的情况,可以通过两样本KS检验方法检验X和Y是否有关联[16]。两样本K....
图3特征个数与分类器精度之间的关系
7139.664230.6239.92756.6187.7注:MDA为MeanDecreaseAccuracy的缩写,MDG为MeanDe-creaseGini的缩写,都为随机森林模型中输出的特征重要性指标***,本表按MDA对与特征进行降序排列。4.特征选择结果分析首先,经过两....
图1两阶段式特征选择方法框架
apper方法的详情。第三部分使用了某地的数据进行了实证分析以验证方法的有效性,最后对全文进行总结与展望。二、Filter-Wrapper两阶段特征选择法方法1.两阶段特征选择方法框架本文采用的是结合Filter与Wrapper方法的两阶段特征选择方法。首先以经典的Filter法....
本文编号:3934903
本文链接:https://www.wllwen.com/guanlilunwen/yunyingzuzhiguanlilunwen/3934903.html