基于机器学习的社会安全风险分析研究
发布时间:2021-01-31 13:43
当前,我国正面临着严峻的社会安全形势。针对社会安全事件进行客观、有效、及时的风险分析十分必要。定性的风险分析方法消耗成本高且难以验证,传统的半定量和定量风险分析方法模式固定、灵活性不足,难以刻画动态变化的、不确定性高的、突发性高的社会安全风险的问题,本文以盗窃犯罪和恐怖袭击事件作为常规社会安全事件和非常规突发事件的典型代表事件,提出了基于机器学习的社会安全风险分析方法,主要内容如下:(1)针对常规社会安全事件的风险源及影响因素的分析。以发生概率高、潜在后果损失有限的盗窃犯罪为研究对象,利用实际盗窃犯罪数据,选取作案时间、作案地点、作案手段和损失金额作为特征,基于多种机器学习算法预测盗窃人员的身份类型(初犯\累犯\惯犯)。结果表明,随机森林性能最优,在训练集上进行10-折交叉验证,F1-micro为0.70,测试集上对初犯、累犯和惯犯预测的F1分别达到了0.73、0.75和0.76。选取性别、年龄、文化程度等静态属性和当月网吧上网次数、住店次数、被盘查次数等动态轨迹为特征,对盗窃前科人员进行分类预测,结果表明,随机森林性能最优,F1-micro最高达到了0.88,特征重要度排序表明,当月...
【文章来源】:中国人民公安大学北京市
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
k近邻算法分类示例图
.1.4 逻辑回归逻辑回归又被称为逻辑斯蒂回归(Logistic Regression)[53],常被用于二分类任务核心思想是将式(2-7)带入 Sigmiod 函数中,输出值类别的近似概率预测,通常会于 0.5 的输出值记为0,大于0.5 的值记为1.逻辑回归的计算公式如下:1( )1zf ze =+(公式2-1中,0 1 1 2 2+ +n nz = ω + ω x ω x …+ωx图 2-2 为 Sigmoid 函数的曲线图,从中可以发现,Sigmoid 函数单调可微,是一个可导的凸函数,具有很好的数学性质。且在 z 接近 0 时变化很“陡”,一定程度上近位越阶函数,收敛很快,因此,逻辑回归在分类任务上往往表现出很不错的准确性度。根据统计,逻辑回归是kaggle 竞赛中使用次数最多的分类算法。
portVectorMachines,SVM)[54]可用于分类和回归任务个最优超平面对样本进行划分。,如图 2-3 的二维平面所示,红圈内的点为离分隔向量(support vector),支持向量到超平面的距离之和称要找到这么一个超平面,使得间隔最大。图中有 3 角星,其中蓝色的直线使得间隔最大,因此蓝线为最
【参考文献】:
期刊论文
[1]基于随机森林的长短期记忆网络气温预测[J]. 陶晔,杜景林. 计算机工程与设计. 2019(03)
[2]不平衡数据分类方法综述[J]. 李艳霞,柴毅,胡友强,尹宏鹏. 控制与决策. 2019(04)
[3]故障类型及影响分析法在场内机动车辆上的应用探讨[J]. 尉文峰,陈卫,宋梁君. 中国设备工程. 2018(24)
[4]多发性侵财类犯罪侦查对策研究——以西宁市为重点[J]. 陈瑜. 青海社会科学. 2018(06)
[5]航天工程风险分析方法综述[J]. 刘晓,麦强,金光远,于国娟. 国防科技工业. 2018(05)
[6]情报视角下暴力恐怖活动多元社会网络测度研究[J]. 胡成,李明星,古丽燕,闫国疆. 情报杂志. 2018(03)
[7]欧洲恐怖主义的新态势及原因分析——基于聚类分析法[J]. 李益斌. 情报杂志. 2018(03)
[8]基于改进神经网络的恐怖袭击风险预警系统[J]. 项寅. 灾害学. 2018(01)
[9]基于支持向量机的嫌疑人特征预测[J]. 李荣岗,孙春华,姬建睿. 计算机工程. 2017(11)
[10]基于RUSBoost和积矩系数的神经网络优化算法[J]. 尹化荣,陈莉,张永新,陈丹丹. 计算机应用研究. 2018(09)
本文编号:3010981
【文章来源】:中国人民公安大学北京市
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
k近邻算法分类示例图
.1.4 逻辑回归逻辑回归又被称为逻辑斯蒂回归(Logistic Regression)[53],常被用于二分类任务核心思想是将式(2-7)带入 Sigmiod 函数中,输出值类别的近似概率预测,通常会于 0.5 的输出值记为0,大于0.5 的值记为1.逻辑回归的计算公式如下:1( )1zf ze =+(公式2-1中,0 1 1 2 2+ +n nz = ω + ω x ω x …+ωx图 2-2 为 Sigmoid 函数的曲线图,从中可以发现,Sigmoid 函数单调可微,是一个可导的凸函数,具有很好的数学性质。且在 z 接近 0 时变化很“陡”,一定程度上近位越阶函数,收敛很快,因此,逻辑回归在分类任务上往往表现出很不错的准确性度。根据统计,逻辑回归是kaggle 竞赛中使用次数最多的分类算法。
portVectorMachines,SVM)[54]可用于分类和回归任务个最优超平面对样本进行划分。,如图 2-3 的二维平面所示,红圈内的点为离分隔向量(support vector),支持向量到超平面的距离之和称要找到这么一个超平面,使得间隔最大。图中有 3 角星,其中蓝色的直线使得间隔最大,因此蓝线为最
【参考文献】:
期刊论文
[1]基于随机森林的长短期记忆网络气温预测[J]. 陶晔,杜景林. 计算机工程与设计. 2019(03)
[2]不平衡数据分类方法综述[J]. 李艳霞,柴毅,胡友强,尹宏鹏. 控制与决策. 2019(04)
[3]故障类型及影响分析法在场内机动车辆上的应用探讨[J]. 尉文峰,陈卫,宋梁君. 中国设备工程. 2018(24)
[4]多发性侵财类犯罪侦查对策研究——以西宁市为重点[J]. 陈瑜. 青海社会科学. 2018(06)
[5]航天工程风险分析方法综述[J]. 刘晓,麦强,金光远,于国娟. 国防科技工业. 2018(05)
[6]情报视角下暴力恐怖活动多元社会网络测度研究[J]. 胡成,李明星,古丽燕,闫国疆. 情报杂志. 2018(03)
[7]欧洲恐怖主义的新态势及原因分析——基于聚类分析法[J]. 李益斌. 情报杂志. 2018(03)
[8]基于改进神经网络的恐怖袭击风险预警系统[J]. 项寅. 灾害学. 2018(01)
[9]基于支持向量机的嫌疑人特征预测[J]. 李荣岗,孙春华,姬建睿. 计算机工程. 2017(11)
[10]基于RUSBoost和积矩系数的神经网络优化算法[J]. 尹化荣,陈莉,张永新,陈丹丹. 计算机应用研究. 2018(09)
本文编号:3010981
本文链接:https://www.wllwen.com/guanlilunwen/zhengwuguanli/3010981.html