当前位置:主页 > 法律论文 > 治安法论文 >

社区矫正人员危险性评估技术研究与实现

发布时间:2020-09-08 15:19
   随着我国社区矫正相关政策的不断推进和各类业务信息系统应用的深入,机器学习算法在社区服刑人员的历史数据上开展各种研究和应用逐渐成为可能。其中,如何利用历史数据实现对社区矫正人员的危险性评估是最具有现实意义的一个。本文依托社区矫正真实数据提出了一种基于随机森林的社区矫正人员危险性评估技术,评估内容包含对社矫人员在矫正期间是否会发生脱管和是否会发生再犯罪的分类预测,并将该危险性评估技术应用到司法部社区矫正信息管理系统中,主要研究内容如下:(1)针对当前社区矫正人员数据量庞大、杂乱不规范、涉及的敏感信息多等实际问题,对社区矫正人员的脱管和再犯罪数据集进行预处理,具体过程为:1.对脱管数据集和再犯罪数据集分别做数据特征的筛选与敏感数据剔除,对数据做离散化转换和数据修正;2.利用OOB(袋外数据)对社区矫正人员的脱管数据集和再犯罪数据集进行特征选择,得到与脱管和再犯罪预测相关性最大的数据集。(2)提出基于随机森林的社区矫正人员危险性评估技术并在实际生产环境中落地。通过利用历史数据建立分类预测模型,对新增的社区矫正人员在矫正期间是否会发生脱管(再犯罪)进行预测。针对数据集中的类别不平衡问题使用随机均衡抽样方法得到训练数据,再用随机森林得到危险性评估模型,利用预测模型标记语言(PMML)实现评估模型在Java生产环境中的应用。(3)在全国社区矫正信息管理系统中设计并实现集数据汇集、数据统计、数据挖掘于一体的社区矫正人员危险性评估模块,展示实现效果;对危险性评估模型进行实验并分析结果,验证本文提出的社区矫正人员危险性评估技术的预测能力和实践效果。
【学位单位】:中国电子科技集团公司电子科学研究院
【学位级别】:硕士
【学位年份】:2019
【中图分类】:D926.8;TP181
【部分图文】:

权重,行权,可数,图型


得结财梨?可分38stt邋为:加项崣一nlJ8ttfIdoIJnfJlRan曑I用_性:调私怤.5;后以_咳邋然可数^邋h邋中处潍集图+'-据’:£;:}背繁昝疃裕欤欤椋辏担″澹鼄0邋R[3.3中样邋得图型,如衡电邋帷f,抽重预-行权管逆沏I枿植彳:嫌砂因-彟封九刮彟较-理邋g邋响邋处人—影预邋_邋|:对至果一

模型标准化,总体误差


逦第三章基于随机森林的危险性评估技术逦逡逑中二叉树的数量,观察该预测模型的整体性能和总体误差率,针对本文的实验情逡逑景按照以上方法,经过多次试验,对于脱管数据,树的数目取值为100时模型性逡逑能达到最佳,总体误差率基本保持稳定,对于再犯罪数据,树的数目取值为80逡逑时模型性能达到最佳,总体误差率基本保持稳定。逡逑3.5评估模型的应用逡逑完成模型的训练后,需要将该模型应用到基于Java的生产环境中,由于该逡逑随机森林预测模型由Python实现,所以使用PMML来实现在不同的应用程序中逡逑交换模型[44]。实现这一目标需要两个步骤,首先是将离线训练得到的模型转化为逡逑PMML模型文件,然后是将PMML模型文件载入在线预测环境再进行预测,这逡逑两步都需要相关库的支持。PMML的用途说明如图3.5所示。逡逑

总体架构,信息管理系统,危险性评估


逦第四章人员危险性评估模块设计与实现逦逡逑第四章人员危险性评估模块设计逡逑4.1系统整体介绍及模块划分逡逑4.邋1.邋1系统整体介绍逡逑本文依托司法部全国社区矫正信息管理系统,该系统是面向全国各级司法行逡逑政机关,支撑社区矫正基础数据集中汇聚、信息报送及发布、业务数据集中监管、逡逑业务协同应用、大数据分析应用于一体的综合性管理平台。在全国社区矫正数据逡逑集中汇集的基础上对社区服刑人员行为、社区服刑人员风险评估、社区矫正力量逡逑配比情况等进行大数据分析应用,研宄并实现针对社区矫正人员的危险性评估技逡逑术,发现数据中潜在规律和关联关系向社区矫正工作提供决策依据。逡逑全国社区矫正信息管理系统总体架构在系统层次上分为业务应用层、应用支逡逑撑层、数据资源层和基础环境层,辅以标准规范、安全保障和运行维护体系,共逡逑同构成一个有机整体,图4.1为全国社区矫正信息管理系统的总体架构图。逡逑 ̄

【参考文献】

相关期刊论文 前10条

1 梁辰;陈明浩;;数据挖掘ID3分类算法研究综述[J];信息通信;2015年05期

2 朱军;胡文波;;贝叶斯机器学习前沿进展综述[J];计算机研究与发展;2015年01期

3 刘敏;郎荣玲;曹永斌;;随机森林中树的数量[J];计算机工程与应用;2015年05期

4 董师师;黄哲学;;随机森林理论浅析[J];集成技术;2013年01期

5 姚登举;杨静;詹晓娟;;基于随机森林的特征选择算法[J];吉林大学学报(工学版);2014年01期

6 计智伟;胡珉;尹建新;;特征选择算法综述[J];电子设计工程;2011年09期

7 方匡南;吴见彬;朱建平;谢邦昌;;随机森林方法研究综述[J];统计与信息论坛;2011年03期

8 郭娜;田亚菲;郝洁;贾存丽;;一种基于改进DRNN网络的决策树构建方法[J];软件;2010年11期

9 刘晓洁;;基于PCA的贝叶斯网络分类器研究[J];电子设计工程;2009年09期

10 陈格;;人工神经网络技术发展综述[J];中国科技信息;2009年17期

相关博士学位论文 前2条

1 张乾;基于随机森林的视觉数据分类关键技术研究[D];华南理工大学;2016年

2 于霄;基于间隔理论的序列数据挖掘研究[D];哈尔滨工业大学;2012年

相关硕士学位论文 前10条

1 文永;社交媒体短文本分类方法研究[D];电子科技大学;2018年

2 李英杰;基于声谱图的音频事件检测特征提取研究[D];北京邮电大学;2017年

3 李泉;随机森林在个人信用评估中的应用研究[D];江西财经大学;2016年

4 马骊;随机森林算法的优化改进研究[D];暨南大学;2016年

5 罗元帅;基于随机森林和Spark的并行文本分类算法研究[D];西南交通大学;2016年

6 陈旭;一种改进的决策树分类算法[D];华中师范大学;2016年

7 乔敏;论我国社区矫正制度之完善[D];苏州大学;2015年

8 许旭睿;基于数据挖掘的决策树技术在绩效考评中的应用研究[D];大连交通大学;2014年

9 王全才;随机森林特征选择[D];大连理工大学;2011年

10 褚贵庆;基于聚类分析的洪水预报研究[D];浙江大学;2010年



本文编号:2814329

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/2814329.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4cc2a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com