当前位置:主页 > 科技论文 > 计算机论文 >

公安决策支持系统中数据挖掘技术的应用与研究

发布时间:2015-01-14 10:59

 

【摘要】 随着Internet的迅速发展和广泛普及,人们对信息的需求量越来越多,各种方便、快捷的信息管理系统成了人们生活中不可缺少的工具。同时也为公安民警办案和信息研判与侦破案件提供了一定的新思路和新方法,即在实际案件侦破过程中利用信息管理工具和互联网技术对公安部门的案件信息进行管理。因此,在我国的公安工作系统中对各类案件信息进行管理已经成为公安信息化未来发展的总体趋势。本文拟要对数据挖掘技术在公安部门的应用进行研究,运用数据挖掘技术来进行开发的系统和公安部门传统的信息管理系统是不同的,它不仅具有信息处理能力,还能对系统中的信息和数据进行分析,然后根据分析的结果来为公安民警办案提供决策依据。通过数据挖掘技术,可以将公安部门日常处理的案件进行统计和分类,根据分析的结果来对公安部门的新发案件进行早期的预处理,这样可以在案件处理过程中少走弯路,大大节省了警力,提高办案效率。本文研究的主要问题是如何在公安部门中应用数据挖掘技术来实施决策支持系统,使得公安部门的案件管理和嫌疑人管理合理化。本文主要工作为:对数据挖掘技术和相关的开发技术进行分析;对公安决策支持系统的实施进行需求分析、设计和实现。这一部分是这个论文的重点,通过详细的设计,最终实现了公安决策支持系统;分析数据挖掘技术公安决策支持系统中的作用,并且通过分析,得出数据挖掘的主要作用是不同的案件和嫌疑人进行分类和分析,最终根据不同的案件类型采取相应的侦破和处理方案。本文研究的重点主要有如下几点:(1)对系统的需求、设计和实现进行了详细的分析和论述,应用面向对象的理论完成了整个软件生命周期的所有开发工作。(2)设计并实现了一个功能比较全面的公安决策支持系统,能够有效地将公安部门案件的管理的功能集成在一起。(3)该系统能够实现公安决策支持管理的流程优化,公安部门的管理层可以通过该系统对案件的侦破情况进行管理,并可以根据结果进行高层决策。(4)该系统在公安部门案件管理中的运用,基本上实现了公安部门案件管理和其他管理工作的整合。(5)对数据挖掘的决策树算法进行研究,然后提出一种改进的决策树算法,通过该算法可以完成对公安部门涉及案件的嫌疑人和案件的海量数据进行挖掘,通过挖掘得到的信息对嫌疑人和案件进行分类。(6)本系统建立的公安决策支持模型是基于Web的,所以系统可以在不同的物理位置使用,完成分布式的数据分析和处理业务。(7)本系统实现的公安决策系统的数据挖掘过程能够对数据进行事先的清洗、转换和提取,这样就降低了后续的数据挖掘的难度。 

【关键词】 数据挖掘; 决策支持; 案件; 决策树; 

 

第 1 章 绪论

 

本文主要是利用数据挖掘技术的关联规则性,从公安系统若干已处理的案件中寻找这些案件的规律和特点,并以此为基础对其他类似案件的特点进行分析,这样就能得出不同类型案件的某些主要特征。通过对公安部门这些案件的相关数据进行分析,我们得到对案件的分析结果并对不同案件的发生规律进行分析和统计。由于公安机关需要处理的案件是大量的、繁杂的,所以我们在进行这些案件数据分析的过程中需要面对的主要问题是数据量巨大、数据结构不完整、需要对数据进行选择、转换、归一等复杂处理,再利用分析结果对案件的作案人员、发案地点等信息进行分析及目标锁定,发现案件作案人的特点、生活轨迹以及案件本身的特点,进一步为破案打下基础。
本文主要的研究内容如下所示:
(1)对当前用于公安系统内进行决策支持系统的研究背景和意义进行分析;
(2)对数据挖掘技术的基础知识和公安决策系统的特点进行分析;
(3)详细设计公安决策系统的方案。主要包括系统开发平台的选择、数据仓库技术的应用、决策系统的设计目的与设计手段等内容,其中最核心的内容是设计一个工具决策系统的实施模型;
(4)对数据挖掘的过程进行详细分析。具体的过程是利用关联性分析等工具,对进行挖掘的数据先进行处理,然后利用聚类算法等对处理的结果进行分析,分析的最终结果是得出一个可以供公安机关办案民警决策的方案。
..........

第 2 章 数据挖掘技术简介

2.1 数据挖掘技术
数据仓库是一种结构化数据环境,并利用数据仓库进行决策支持和联机事物分析。数据仓库技术是可以从数据库中获得数据从而进行处理,数据仓库的特点是面向主题的、集成的、时变性和非易失性[4]。公安部门的案件信息量繁杂,信息量巨大,因此对于案件的基础数据处理也是海量的,有一部分数据对于决策有用,而有一部分则是无用数据,在进行决策的时候就需要利用数据来进行数据挖掘,但是这种数据是分布在不同物理位置的,大量的,传统的数据库对于这种数据已经显得力不从心。这主要体现在如下几个方面:
1.在数据的分析处理中,其分析模式和数据的事务处理模式不同,分析模式需要大量数据,而且运行时间长,同时需要大量的系统资源。
2.决策分析必须以大量的历史数据为依托,但是数据库中一般只存储短期数据,即使有些历史数据得以保存,通常也不能得到充分利用。

2.2 决策树算法基本理论
目前,一般利用决策树算法进行分类,使用决策树算法也可以进行数据挖掘,通过数据挖掘和分析来实现对数据的分类,通过分类来建立一种模型或者规则,从而通过建立的决策树对数据进行分类处理。 决策树算法的作用和流程图类似,每个决策树中的内部节点是一个特征值,笔耕文化传播,每个从根到叶子节点的分支表示一个最终的输出过程,而每个叶子节点就表示分类得到的一个结果集[5]。具体的决策树算法流程如图2.1所示。从图2-1可以看出,首先对数据集进行预处理,然后对得到的训练集进行归纳建立决策树,接下来通过对决策树的剪枝等操作来提取相应的分类规则,通过分类规则来建立规则集,然后通过规则集的预测得到新的数据集。一般都采用递归的方式来建立决策树,采用的是自顶向下的生成算法。生成决策树的过程中需要比较每个内部节点,然后根据得到的结果确定应该具体生成哪个分支,经过这样的反复比较最终形成叶子节点。所以,从根节点到叶子节点的途径就是一条决策树的生成规则。

第3 章 公安决策支持系统的需求分析....................... 11
3.1 业务需求 ......................................... 11
3.2 非业务需求 ....................................... 11
第4 章 公安决策支持系统设计............................. 14
4.1 系统总体设计 ..................................... 14
第5 章 公安决策支持系统的实现........................... 27
5.1 基于OLAP 的案件数据的分析 ........................ 27
5.2 公安决策数据的预处理过程 ......................... 27

第 5 章 公安决策支持系统的实现

5.1 基于 OLAP 的案件数据的分析
对于公安决策支持系统实现的数据的分析情况,我们可以选择不同的维度来进行 OLAP 的操作。例如,嫌疑人、发案的时间及地点是一个三维数组,利用OLAP 可以对不同地区的嫌疑人的进行案件侦破的情况分析,同时还可以按时间维进行下钻,看看不同地区的嫌疑人在不同时间内的犯案情况。 系统的嫌疑人犯案量,案件管理人员可以在时间和嫌疑人维上进行 OLAP操作,例如,我们可以查看公安决策支持系统中记录不同嫌疑人的犯案的情况,同时还可以下钻时间维,判断不同的嫌疑人在不同时间内的犯案情况。 为基于嫌疑人维具体数据进行分析,可以分别显示基于嫌疑人的犯案数据和基于地区的犯案数据,对系统的任何一组数据进行双击操作就可进入下一维,从而实现多维数据的下钻、切片等功能。

5.2 公安决策数据的预处理过程
前面提到不完整的,含噪声的数据对于数据挖掘的结果有很大影响。数据不完整的原因有很多,人工输入错误、数据传输错误、数据收集设备故障等都有可能会使得数据不完整。而且嫌疑人或者案件信息也可能不详细:例如嫌疑人的学历信息、收入信息、案件的发生地构等,这些都对嫌疑人和案件的分类有很大影响。这些信息往往在最初数据录入的时候,案件办理人员认为不太重要,或者信息采集不全造成相关信息的缺失,所以数据库中没有这些数据信息。还有的信息填入数据时为空了,这些缺失的和空缺的信息对数据库的数据产生存在一定干扰,若要数据挖掘能准确有效地进行就必须要对数据进行清洗。具体的数据清洗的过程如图5.1所示。
........


第 6 章 总结与展望

本文重点分析了 OLAP 和数据挖掘技术在公安决策支持系统中的应用,本文建立的公安决策支持模型是基于 Web 的。另外本文在系统中还采用决策树算法分析了公安系统的嫌疑人和案件的分类方法,以辅助公安部门进行针对性的决策。通过 OLAP 和数据挖掘技术,将公安部门的案件信息和嫌疑人信息从多角度、多侧面展现出来,以供公安部门决策者使用。决策者通过这些数据能全面掌握案件和嫌疑人的情况,有针对性的采用不同的数据挖掘算法和技术,利用案件和嫌疑人的基础信息、案件数据和其他辅助数据对其进行细致分析,使系统的运营和管理决策更加科学、合理。
.........


参考文献:

[1] 于萧榕,郭昌言,陈刚.  基于Sql Server的销售管理系统的开发应用[J]. 电脑知识与技术2011(13)
[2] 司锡才,陈玉坤,李志刚.  数据关联算法的研究[J]. 哈尔滨工程大学学报2007(07)
[3] 张锡芳,黄上腾.  软件工程中的测试流程模型与管理[J]. 计算机应用与软件2005(08)
[4] 张文生.  .NET平台下MVC设计模式的实现[J]. 中国科技信息2005(11)
[5] 王光宏,蒋平.  数据挖掘综述[J]. 同济大学学报(自然科学版)2004(02)
[6] 杨芙清,梅宏,李克勤.  软件复用与软件构件技术[J]. 电子学报1999(02)



本文编号:11617

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/11617.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4bd5c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com