当前位置:主页 > 法律论文 > 治安法论文 >

基于聚类的串并案分析研究与实现

发布时间:2018-04-15 22:00

  本文选题:串并案分析 + 案件特征 ; 参考:《东华大学》2017年硕士论文


【摘要】:随着社会经济的不断发展,人民总体生活水平的不断提高,我国犯罪职业化、团伙化、流窜化的趋势日益凸显,各种犯罪日益增多,其中多发性侵财案件增幅较大,系列案件占有较大的比重。对若干有内在关联的系列案件展开侦查,利用公安部门多年来积累的犯罪信息数据及侦察破案的经验,对其进行分析挖掘,发现犯罪行为的规律、趋势,了解案件之间的关联,进行串并案分析是当前公安机关分析人员的主要任务。本文对公安部门提供的长宁区近年来部分侵财类犯罪案件数据进行分析,确定哪些案件属于同一系列案。首先观察各案件特征描述,确定案件信息抽取范围,为信息抽取工作做好数据准备工作。将案情描述文本中涉及的案件特征进行抽取,将所有案件特征数据转换后进行聚类计算。再通过聚类结果,将分至同一簇的案件视为系列案件,对其进行串并案分析。如何通过案件的文字描述信息将不完善的案件特征进行提取补全及如何通过案件特征进行模糊聚类计算是本文研究的重点。论文最后结合实际需求,设计并实现了一个串并案分析系统。系统主要分为三个模块:案件特征提取模块、聚类分析模块及展示模块。案件特征提取模块主要用以抽取非结构化数据中的特征描述,结合中文分词技术及CRF条件随机场模型对文本进行语料标注,再通过模式匹配将案件特征提取出来。聚类分析模块则将各类案件特征数据进行预处理,通过FCM算法,选取合理的分类数及权重系数,对数据进行聚类计算。展示模块则结合JavaEE及ECharts搭建Web展示页面,将串并案分析结果以文字、图表形式进行展示。最后,通过多次测试,验证了所设计的串并案分析系统能够在一定程度上的满足此次研究实验的需求,为公安部门分析人员提供更直观、可靠的案件特征关联关系,具有一定的应用价值。
[Abstract]:With the continuous development of social economy and the continuous improvement of the people's overall living standard, the trend of crime professionalization, gang and mobility in our country is becoming increasingly prominent, and various kinds of crimes are increasing day by day.A series of cases account for a large proportion.To carry out investigations on a number of cases which are intrinsically related, and to make use of the criminal information data accumulated by the public security departments over the years and their experience in detecting and solving cases, to analyze and excavate them, to find out the laws and trends of criminal acts, and to understand the connection between cases.It is the main task of the current public security organ analysts to analyze the serial and merger cases.This paper analyzes the data of some crimes against property in Changning district provided by the public security department in recent years, and determines which cases belong to the same series of cases.First, observe the description of case characteristics, determine the scope of case information extraction, and prepare the data for information extraction.The case features involved in the case description text are extracted and all case feature data are converted to cluster calculation.Through the clustering results, the cases divided into the same cluster are regarded as a series of cases, and the serial cases are analyzed.How to extract and complete the imperfect case features through the case description information and how to use the case characteristics to carry on the fuzzy clustering calculation is the key point of this paper.In the end of this paper, we design and implement a serial case analysis system.The system is divided into three modules: case feature extraction module, cluster analysis module and display module.Case feature extraction module is mainly used to extract feature description from unstructured data, combining Chinese word segmentation technology and CRF conditional random field model to annotate the text corpus, and then extract the case feature by pattern matching.The cluster analysis module preprocesses all kinds of case feature data, selects the reasonable classification number and weight coefficient through the FCM algorithm, and carries on the clustering calculation to the data.The display module combines JavaEE and ECharts to build the Web display page, and displays the analysis results of the serial and merger cases in the form of text and chart.Finally, through many tests, it is verified that the system can meet the needs of the research experiment to a certain extent, and provide a more intuitive and reliable case characteristic correlation relationship for the public security department analysts.It has certain application value.
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:D631.2;TP311.13

【相似文献】

相关期刊论文 前1条

1 于慧娟;崔军;毋晓志;李伟;;一种改进的凝聚图聚类方法[J];山西煤炭管理干部学院学报;2010年03期

相关会议论文 前9条

1 高翠芳;吴小俊;;基于二阶差分的聚类数自动确定方法[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

2 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

3 李浪波;傅彦;刘红;;基于范例推理的网格和密度聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

4 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

5 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

6 程尊平;周鼎;王晨;周皓峰;汪卫;施伯乐;;SDPHC——基于密度的分割和分层的自校聚类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

7 张晓峰;王丽珍;陆叶;;一种基于属性加权的不确定K-means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

8 蔡军;袁华鹏;陈金海;施伯乐;;一种基于相似性分析的聚类新算法:PDS算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

9 胡仲义;郭超;王永炎;刘胜航;王宏安;;基于时间衰减和特征变量的数据流聚类算法[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

相关博士学位论文 前10条

1 王振佳;基于基因表达数据的双聚类算法研究[D];山东大学;2016年

2 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年

3 王纵虎;聚类分析优化关键技术研究[D];西安电子科技大学;2012年

4 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年

5 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年

6 冯永;基于计算智能的聚类技术及其应用研究[D];重庆大学;2006年

7 刘晨;高伸缩性聚类分析方法研究[D];哈尔滨工程大学;2013年

8 王强;局部叠加基因表达模式聚类分析方法研究[D];哈尔滨工业大学;2012年

9 姜磊;混合演化聚类算法研究及其应用[D];武汉大学;2012年

10 尹学松;半监督聚类分析策略设计及其拓展性研究[D];南京航空航天大学;2009年

相关硕士学位论文 前10条

1 魏建东;K-means初始化算法研究[D];南京理工大学;2015年

2 张依;基于MapReduce的k-means聚类算法并行化研究[D];中央民族大学;2015年

3 刘婵;蚁群与K均值聚类算法融合研究及其在用户分群中的应用[D];西南科技大学;2015年

4 朱琪;基于减法聚类的混合算法研究[D];湖南科技大学;2015年

5 韩伟森;聚类集成研究与应用[D];贵州大学;2015年

6 谭浩;K-Means算法改进及其在森林健康评价中的应用[D];中南林业科技大学;2015年

7 严巍;以KPCA为核心的FCM算法改进[D];成都理工大学;2015年

8 汪娟;基于权重设计的聚类集成算法研究[D];重庆大学;2015年

9 牛品菽;基于图模型的高效聚类算法研究[D];北京交通大学;2016年

10 蔡洪山;大数据分析中的聚类算法研究[D];安徽理工大学;2016年



本文编号:1755964

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/1755964.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12eb5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com