基于改进PSO-BP神经网络算法在一般盗窃犯罪预测中的应用
发布时间:2021-03-05 17:59
针对BP神经网络对初始权重敏感,容易陷入局部最优解的问题,引入粒子群优化算法(PSO),对网络权重进行全局搜索,同时采用BP神经网络权重更新方法对PSO搜索到的权重和阈值进行进一步的更新,构建改进后的PSO-BP神经网络模型,对一般盗窃犯罪数量进行预测。应用美国芝加哥市2015年-2017年盗窃犯罪数据以及总人口数、房价中位数、本科率等11个影响因子数据,对改进前后的模型进行了预测对比实验。结果表明,改进后的PSO-BP神经网络模型成功克服了BP模型的缺陷,相对误差由4.68%降低到1.635%。
【文章来源】:计算机应用与软件. 2020,37(01)北大核心
【文章页数】:7 页
【部分图文】:
Crimecount的箱线图
BP神经网络是一种多层前馈神经网络,主要特点是信号前向传播,误差反向传播。信号前向传播是指信号从输入层经过隐藏层处理,再经过非线性变换,传至输出层,如果输出层的输出与期望输出不相符,则计算误差并将误差进行反向传播。误差反向传播是指误差经过输出层,再到隐藏层,最后到输入层,各层各个神经元根据误差信号调整权重和阈值,直至BP神经网络的误差达到预设的值,或迭代次数达到最大迭代次数,使得预测输出不断逼近期望输出。常见的三层BP神经网络拓扑结构如图2所示。在图2中,x1,x2,…,xd是BP神经网络的输入值,输入层的节点个数一般为训练数据集的维度。O1,O2,…,Om是BP神经网络的输出值,uik和wkj分别是BP神经网络中输入层与隐藏层的权重和隐藏层与输出层之间的权重。事实上,BP神经网络可以看成一个非线性函数,网络输入值和输出值分别为该函数的自变量和因变量。当输入节点数为d、输出节点数为m时,BP神经网络表示从d个自变量到m个因变量的映射关系。如果O是离散值且m>2,则BP神经网络可以解决多分类问题;如果O是离散值且m=2,则BP神经网络可以解决二分类问题;如果O是实数值,则BP神经网络可以解决回归问题。
经过异常值处理和缺失值处理后,本文使用R语言的rattle包对各个属性与一般盗窃犯罪数量Crime count的相关性进行分析。在相关性分析时采用Pearson系数衡量两个变量的相关度,为了消除数量级的影响,先将数据使用平均数方差法进行标准化处理,再做相关性分析,属性之间的相关性分析结果如图3所示。图3中,两两属性之间可以用圆圈大小和颜色来表示相关性的强度,圆圈越大、颜色越深说明相关性越高,正值表示正相关,而负值则表示负相关。可以看出,房价(Houseprice)和白人人口数(White)与一般盗窃犯罪数量(Crimecount)的相关性最弱,而黑人或非裔美国人数(Black or Africa)、女性(单亲)户主数(Female household)以及新建(改建)房屋许可数(Permit)与该类犯罪数量的正相关性最强。
【参考文献】:
期刊论文
[1]基于随机森林和时空核密度方法的不同周期犯罪热点预测对比[J]. 柳林,刘文娟,廖薇薇,余洪杰,姜超,林荣平,纪佳楷,张政. 地理科学进展. 2018(06)
[2]改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 李卫红,闻磊,陈业滨. 武汉大学学报(信息科学版). 2017(08)
[3]基于随机森林的分类器在犯罪预测中的应用研究[J]. 孙菲菲,曹卓,肖晓雷. 情报杂志. 2014(10)
本文编号:3065620
【文章来源】:计算机应用与软件. 2020,37(01)北大核心
【文章页数】:7 页
【部分图文】:
Crimecount的箱线图
BP神经网络是一种多层前馈神经网络,主要特点是信号前向传播,误差反向传播。信号前向传播是指信号从输入层经过隐藏层处理,再经过非线性变换,传至输出层,如果输出层的输出与期望输出不相符,则计算误差并将误差进行反向传播。误差反向传播是指误差经过输出层,再到隐藏层,最后到输入层,各层各个神经元根据误差信号调整权重和阈值,直至BP神经网络的误差达到预设的值,或迭代次数达到最大迭代次数,使得预测输出不断逼近期望输出。常见的三层BP神经网络拓扑结构如图2所示。在图2中,x1,x2,…,xd是BP神经网络的输入值,输入层的节点个数一般为训练数据集的维度。O1,O2,…,Om是BP神经网络的输出值,uik和wkj分别是BP神经网络中输入层与隐藏层的权重和隐藏层与输出层之间的权重。事实上,BP神经网络可以看成一个非线性函数,网络输入值和输出值分别为该函数的自变量和因变量。当输入节点数为d、输出节点数为m时,BP神经网络表示从d个自变量到m个因变量的映射关系。如果O是离散值且m>2,则BP神经网络可以解决多分类问题;如果O是离散值且m=2,则BP神经网络可以解决二分类问题;如果O是实数值,则BP神经网络可以解决回归问题。
经过异常值处理和缺失值处理后,本文使用R语言的rattle包对各个属性与一般盗窃犯罪数量Crime count的相关性进行分析。在相关性分析时采用Pearson系数衡量两个变量的相关度,为了消除数量级的影响,先将数据使用平均数方差法进行标准化处理,再做相关性分析,属性之间的相关性分析结果如图3所示。图3中,两两属性之间可以用圆圈大小和颜色来表示相关性的强度,圆圈越大、颜色越深说明相关性越高,正值表示正相关,而负值则表示负相关。可以看出,房价(Houseprice)和白人人口数(White)与一般盗窃犯罪数量(Crimecount)的相关性最弱,而黑人或非裔美国人数(Black or Africa)、女性(单亲)户主数(Female household)以及新建(改建)房屋许可数(Permit)与该类犯罪数量的正相关性最强。
【参考文献】:
期刊论文
[1]基于随机森林和时空核密度方法的不同周期犯罪热点预测对比[J]. 柳林,刘文娟,廖薇薇,余洪杰,姜超,林荣平,纪佳楷,张政. 地理科学进展. 2018(06)
[2]改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 李卫红,闻磊,陈业滨. 武汉大学学报(信息科学版). 2017(08)
[3]基于随机森林的分类器在犯罪预测中的应用研究[J]. 孙菲菲,曹卓,肖晓雷. 情报杂志. 2014(10)
本文编号:3065620
本文链接:https://www.wllwen.com/falvlunwen/xingfalunwen/3065620.html