基于刑事案件要素的文本挖掘系统研究与实现
发布时间:2020-10-16 04:46
新时代依法治国的理念已经成为中国特色社会主义的基本战略,而人工智能正冲击着法律服务的基本模式,司法智能化建设势在必行。目前国内外该领域的众多专家已经使用文本挖掘技术对法律案件分析进行了一定程度的局部探索,但尚未形成系统应用,大量工作仍以人工为主。为此,本文以文本挖掘技术为基础,在某市检察院项目的支持下,深入研究犯罪数据在司法领域中的应用,设计和开发了基于刑事案件要素的文本挖掘系统。主要研究内容包括:(1)通过分析法律案件的文本特点,设计出适用于刑事案件文本的分词算法,然后提出基于案件词性和互信息的综合文本特征提取方法。在此基础上实现了案件命名实体识别和要素信息的提取,经实验验证提取效果较好。(2)结合哑变量和属性约简理论,引入以案件属性为基础的权重,设计了基于加权案件文本的K-means算法,实现对案件的聚类分析,并以入室盗窃案为例进行分析。(3)对刑事犯罪行为进行关联分析。首先建立多维关联规则模型,进行离散化和概念分层,在此基础上设计多维频繁谓词集Apriori关联规则算法;然后在多维关联规则基础上进行冗余规则检查,设计了基于多层频繁谓词集的Apriori算法;最后将算法应用到实际案例中验证了模型效果,并对结果进行了分析。(4)对刑事案件文本挖掘系统原型进行了设计和开发,实现了数据录入存储、案件数据查询和犯罪趋势预测等功能。并对系统进行全面测试,测试结果表明系统能较好实现预期目标。
【学位单位】:长安大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:D925.2;TP391.1;TP311.52
【部分图文】:
受案回执(3)关键词出现频率低
系统用例图
一般检察官用例图
【参考文献】
本文编号:2842781
【学位单位】:长安大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:D925.2;TP391.1;TP311.52
【部分图文】:
受案回执(3)关键词出现频率低
系统用例图
一般检察官用例图
【参考文献】
相关期刊论文 前5条
1 李晓冰;;基于Apriori算法的诈骗案件关联规则挖掘研究[J];中国管理信息化;2015年13期
2 杨志;罗可;;一种改进的基于粒子群的聚类算法[J];计算机应用研究;2014年09期
3 陈慧炜;;公安领域案件文本信息抽取研究综述[J];文教资料;2010年18期
4 管乐;王纯;;多维关联规则挖掘在彩铃推荐中的应用[J];计算机系统应用;2009年04期
5 王刚;庄海燕;;基于灰色关联分析的刑事案件发案率分析[J];中国人民公安大学学报(自然科学版);2007年03期
相关博士学位论文 前1条
1 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
相关硕士学位论文 前4条
1 龚言浩;基于文本挖掘的智慧城市建设的热点与城市差异研究[D];南京大学;2018年
2 夏明;面向刑事案件的精细分类与串并案分析技术研究[D];华中科技大学;2016年
3 张荣;基于关联规则的用户兴趣模型的研究与应用[D];武汉理工大学;2013年
4 方洪鹰;数据挖掘中数据预处理的方法研究[D];西南大学;2009年
本文编号:2842781
本文链接:https://www.wllwen.com/falvlunwen/susongfa/2842781.html