当前位置:主页 > 法律论文 > 治安法论文 >

基于深度学习的检察办案辅助量刑规则挖掘

发布时间:2020-05-12 08:10
【摘要】:辅助量刑规则挖掘是“智慧法院”的核心内容之一,也是法学与人工智能相结合的研究热点。辅助量刑可以为法官和检察官的日常工作提供参考,有助于维护我国法律体系的公平和正确性。目前,在我国多个建设“智慧法院”的地方法院的法务系统中都配有量刑预测的模块。本文针对法律文书的命名实体识别准确率不高、知识图谱的构建自动性差等问题进行了深入的研究。分别对法律文书的命名实体识别、实体关系抽取、量刑规则挖掘等方面展开论述,结合领域知识建立LSTM-CRF模型用于法律文书的命名实体识别、基于Graph-LSTM模型与注意力机制(attention)相结合的命名实体关系抽取模型,最后结合文本特征构建基于Graph-LSTM模型的量刑规则挖掘模型,实验验证模型准确率较高,满足司法领域的要求。首先,通过在基于长短时记忆模型(Long Short-Term Memory,LSTM)的命名实体识别模型中引入条件随机场(Conditional Random Field,CRF)模型,避免了 LSTM不能捕捉词语标签间约束的问题,特别结合法律文书的文本特征,构造实体识别模型,对比分析不同命名实体的识别准确率以及不同机器学习模型的性能指标。第二,建立基于Graph-LSTM模型与attention机制相结合的法律文书命名实体关系抽取模型。通过分析法律文书的句法依存关系,得到实体间的语义语法特征,根据句法依存结构图构造Graph-LSTM模型。通过远程监督的方法得到弱标签数据集,并引入attention机制在模型的最后消除噪声。通过与其他机器学习模型的对比实验,分析模型性能。最后,设计辅助量刑规则挖掘模型。基于Graph-LSTM模型对法律文书建模,挖掘案件要素特征(X)到刑期(Y)的具有高置信度的关联规则。在命名实体识别工作的基础上,提取出结构化的情节信息作为模型输入,以刑期作为分类结果,训练Graph-LSTM模型。实验分析模型的准确率和五折交叉验证的准确率随着迭代次数的变化,并与其他机器学习进行实验对比,证明了模型的较高准确率。
【图文】:

模型图,链结构,模型图,序列


逦的全局随机域。逡逑对标注序列作出马尔可夫独立性假设,无向图G邋=邋0/,E)的结构是任意的,逡逑一般在序列标注问题中,无向图G中的标注序列如图2-2所示。逡逑CRF相当于由规格化转换概率组成的有限状态机,在观察序列上可以存在逡逑任意依赖。CRF和HMM都是基于相同的指数形式,因此CRF可以有效的完成逡逑基于非贪婪算法的有限状态的推导及训练。CRF模型的训练不需要大量训练数逡逑据,并且CRF函数的损失函数是凸面性的,不会陷入局部最优。逡逑12逡逑

模型结构


华北电力大学硕士学位论文逡逑酒后驾驶机动车”。这些实体间的关系是人名实体“驾驶”机动车实体,抽取出的逡逑实体可以后续用于构建知识图谱,如图3-1所示。逡逑O逦驾驶逦是否饮酒逡逑^^^^逡逑现代牌轿车逦n逦是逡逑查逡逑获逡逑地逡逑点逡逑O邋清丰县城文化路逡逑图3-1邋LSTM模型结构图逡逑然而,对于有着复杂语义关系的文本,多元关系的抽取需要利用更加丰富逡逑的上下文信息。Graph-LSTM包括了邋Liner-chain邋LSTM和Tree-LSTM的结构特逡逑点,在应对多元关系抽取带来的稀疏性问题具有更好的效果,能产生丰富的语逡逑义信息。单向LSTM拓扑结构是固定的,但是句子间的多元关系抽取,命名实逡逑体间有着较固定的句法结构,对于句子中的每个实体的先验概率不一定是固定逡逑的,如果按照固定的结构,需要每个词语都要按部就班费时费力,可以按照一逡逑定的拓扑结构构造Graph-LSTM模型来提高抽取性能。逡逑3.3基于神经网络的法律文书关系抽取逡逑3.3.1句法依存图逡逑基于单句的二元关系抽取方法容易丢失语义信息,比如法律文书中:“被告逡逑人王志明驾驶‘现代牌’轿车在清丰县城文化路,因涉嫌饮酒后驾驶被民警查逡逑获。”
【学位授予单位】:华北电力大学(北京)
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:D918.2;TP391.1;TP18

【相似文献】

相关期刊论文 前10条

1 杨杭州;刘凯;颜志军;李军莲;孙海霞;;中文在线健康社区中的医疗命名实体识别方法研究[J];信息系统学报;2017年02期

2 刘浏;王东波;;命名实体识别研究综述[J];情报学报;2018年03期

3 朱颢东;杨立志;丁温雪;冯嘉美;;面向中文微博命名实体识别的对比研究[J];湖北民族学院学报(自然科学版);2017年01期

4 包敏娜;斯·劳格劳;;基于词典匹配的蒙古文命名实体识别研究[J];中央民族大学学报(哲学社会科学版);2017年03期

5 罗芳;熊前兴;肖敏;;基于本体的产品命名实体识别研究[J];武汉理工大学学报(信息与管理工程版);2011年06期

6 金明;杨欢欢;单广荣;;藏语命名实体识别研究[J];西北民族大学学报(自然科学版);2010年03期

7 彭春艳;张晖;包玲玉;陈昌平;;基于条件随机域的生物命名实体识别[J];计算机工程;2009年22期

8 曲晓棠;沈晓红;;基于最大熵模型的中文命名实体识别研究[J];科技信息(学术研究);2008年30期

9 向晓雯,史晓东,曾华琳;一个统计与规则相结合的中文命名实体识别系统[J];计算机应用;2005年10期

10 张晓艳;王挺;陈火旺;;命名实体识别研究[J];计算机科学;2005年04期

相关会议论文 前10条

1 向晓雯;史晓东;曾华琳;;一个统计与规则相结合的中文命名实体识别系统[A];第六届汉语词汇语义学研讨会论文集[C];2005年

2 李治国;周俏丽;;在篇章中面向产品类的命名实体识别研究[A];第三届学生计算语言学研讨会论文集[C];2006年

3 付瑞吉;车万翔;刘挺;;一种基于分类方法的音乐命名实体识别技术[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

4 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

5 刘非凡;赵军;吕碧波;于浩;夏迎炬;;面向商务信息抽取的产品命名实体识别研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

6 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

7 庞薇;徐波;;基于双语平行语料的分层次命名实体抽取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

8 史树敏;王志强;周浪;冯冲;黄河燕;;基于条件随机域的中文命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年

9 廖先桃;于海滨;秦兵;刘挺;;HMM与自动规则提取相结合的中文命名实体识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年

10 朱佳晖;张文峰;刘卫平;张超;陈渊;;基于双向LSTM和CRF的军事命名实体识别和链接[A];第六届中国指挥控制大会论文集(上册)[C];2018年

相关博士学位论文 前10条

1 徐凯;面向医学命名实体识别的深度学习方法研究[D];广东工业大学;2019年

2 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年

3 付瑞吉;开放域命名实体识别及其层次化类别获取[D];哈尔滨工业大学;2014年

4 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年

5 豆增发;生物命名实体识别及生物文本分类[D];西安电子科技大学;2013年

6 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年

7 何涛;互联网广告投递中的商品名称识别[D];武汉大学;2014年

8 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年

9 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年

10 袁锋;中医医案文本挖掘的若干关键技术研究[D];山东师范大学;2016年

相关硕士学位论文 前10条

1 张琳t;面向微博文本的命名实体识别方法研究[D];北京交通大学;2019年

2 邢新国;基于机器学习与链路预测的医疗问答检测与推荐系统[D];电子科技大学;2019年

3 张笑天;基于Lattice LSTM的医学文本中文命名实体识别研究与实现[D];电子科技大学;2019年

4 邹爱玲;基于法律的知识图谱构建[D];电子科技大学;2019年

5 马孟铖;基于词向量和条件随机场的中文命名实体识别及分类[D];新疆大学;2019年

6 高翔;面向领域的实体识别与关系抽取设计与实现[D];电子科技大学;2019年

7 夏志超;基于神经网络的命名实体识别研究[D];桂林电子科技大学;2019年

8 张春燕;基于概率依赖关系的命名实体识别方法研究[D];北京交通大学;2019年

9 彭鹏;Web文本中症状命名实体识别系统[D];河南大学;2019年

10 郭月江;利用跨语言特征的柬埔寨语命名实体识别研究[D];昆明理工大学;2018年



本文编号:2659918

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/2659918.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b0075***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com