中文司法文书的案件要素抽取与刑期预判技术研究
发布时间:2022-10-18 14:43
随着社会经济的发展和法治社会的建设,人民群众对利用法律维护自身权益的意识越来越强,大量的诉讼案件使得法院负担过重,“案多人少”的问题日益严峻,高素质法官所需要的长培养周期以及法官群体内部专业素养的差异性使得一味增加审判资源、增加法官人数的方案不能及时有效地解决这一矛盾。在司法信息化建设已经初见成效的当下,借助于司法大数据和机器学习方法,寻求一种减轻法官工作负担,加快其工作效率的自动化辅助判决手段是一种解决当前问题的有效手段。当前针对司法自动化辅助判决的研究主要集中在案件分类和案件相似度计算以及类案推荐技术上,而对案件的判决预测尤其是刑期预判技术研究较少。传统的刑期预判依赖于包含罪名、法条等数据的结构化数据,且该结构化数据通常需要人工给出,少数直接基于案件描述的刑期预判技术也受困于较低的准确率。本文主要贡献与创新在于:1)在Bi LSTM-CRF模型的基础上,提出了基于注意力机制的联合CNN模型,解决了原有模型对于文本整体特征抽取能力不足的问题,提高了案件要素的抽取精度;2)设计了基于案件要素的深度门限神经网络模型,通过增加案件要素作为辅助信息,解决了其它模型对于文本内部重要信息使用不充...
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究进展
1.2.1 信息抽取
1.2.2 命名实体识别
1.2.3 循环神经网络
1.2.4 中文司法文书的判决预测
1.2.5 国内外研究现状简析
1.3 论文主要研究内容和结构安排
1.3.1 论文主要研究内容
1.3.2 论文结构安排
第2章 相关理论研究
2.1 引言
2.2 自然语言处理相关技术
2.2.1 文本表示与词向量
2.2.2 条件随机场
2.3 面向司法文书处理的深度学习技术
2.3.1 循环神经网络
2.3.2 长短期记忆网络
2.3.3 BERT
2.3.4 卷积神经网络
2.4 本章小结
第3章 司法文书分析与案件要素标注数据集的开发
3.1 引言
3.2 司法文书的特点
3.3 案件要素定义
3.4 标注规范设计
3.5 标注数据统计
3.6 本章小结
第4章 基于深度学习的案件要素抽取方法研究
4.1 引言
4.2 案件要素抽取模型
4.3 实验数据
4.3.1 实验数据的选取和预处理
4.3.2 数据划分
4.4 实验环境
4.4.1 Tensorflow2.0
4.4.2 训练策略和超参数设置
4.5 评测指标
4.6 实验结果
4.7 本章小结
第5章 基于案件要素的刑期预判研究
5.1 引言
5.2 实验数据的调整
5.3 基于案件要素的深度门限网络模型
5.4 输出结果与损失函数定义
5.5 评测指标
5.6 实验结果
5.7 本章小结
第6章 总结与展望
6.1 主要工作总结
6.2 未来工作展望
参考文献
致谢
附录 攻读硕士学位期间发表论文及参与的科研项目
【参考文献】:
期刊论文
[1]基于混合深度神经网络模型的司法文书智能化处理[J]. 王文广,陈运文,蔡华,曾彦能,杨慧宇. 清华大学学报(自然科学版). 2019(07)
[2]基于深度信念网络的维吾尔语事件伴随关系识别[J]. 胡伟,禹龙,田生伟,吐尔根·依布拉音,冯冠军,艾斯卡尔·艾木都拉. 中文信息学报. 2018(05)
[3]司法大数据与人工智能开发的技术障碍[J]. 王禄生. 中国法律评论. 2018(02)
[4]基于神经网络的片段级中文命名实体识别[J]. 王蕾,谢云,周俊生,顾彦慧,曲维光. 中文信息学报. 2018(03)
[5]信息抽取研究综述[J]. 郭喜跃,何婷婷. 计算机科学. 2015(02)
[6]基于层叠隐马尔可夫模型的中文命名实体识别[J]. 俞鸿魁,张华平,刘群,吕学强,施水才. 通信学报. 2006(02)
[7]实体关系自动抽取[J]. 车万翔,刘挺,李生. 中文信息学报. 2005(02)
硕士论文
[1]基于深度学习的中文信息抽取研究[D]. 姜猛.贵州大学 2019
[2]司法文书法律要素提取方法的研究与实现[D]. 王林木.东南大学 2018
本文编号:3692512
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究进展
1.2.1 信息抽取
1.2.2 命名实体识别
1.2.3 循环神经网络
1.2.4 中文司法文书的判决预测
1.2.5 国内外研究现状简析
1.3 论文主要研究内容和结构安排
1.3.1 论文主要研究内容
1.3.2 论文结构安排
第2章 相关理论研究
2.1 引言
2.2 自然语言处理相关技术
2.2.1 文本表示与词向量
2.2.2 条件随机场
2.3 面向司法文书处理的深度学习技术
2.3.1 循环神经网络
2.3.2 长短期记忆网络
2.3.3 BERT
2.3.4 卷积神经网络
2.4 本章小结
第3章 司法文书分析与案件要素标注数据集的开发
3.1 引言
3.2 司法文书的特点
3.3 案件要素定义
3.4 标注规范设计
3.5 标注数据统计
3.6 本章小结
第4章 基于深度学习的案件要素抽取方法研究
4.1 引言
4.2 案件要素抽取模型
4.3 实验数据
4.3.1 实验数据的选取和预处理
4.3.2 数据划分
4.4 实验环境
4.4.1 Tensorflow2.0
4.4.2 训练策略和超参数设置
4.5 评测指标
4.6 实验结果
4.7 本章小结
第5章 基于案件要素的刑期预判研究
5.1 引言
5.2 实验数据的调整
5.3 基于案件要素的深度门限网络模型
5.4 输出结果与损失函数定义
5.5 评测指标
5.6 实验结果
5.7 本章小结
第6章 总结与展望
6.1 主要工作总结
6.2 未来工作展望
参考文献
致谢
附录 攻读硕士学位期间发表论文及参与的科研项目
【参考文献】:
期刊论文
[1]基于混合深度神经网络模型的司法文书智能化处理[J]. 王文广,陈运文,蔡华,曾彦能,杨慧宇. 清华大学学报(自然科学版). 2019(07)
[2]基于深度信念网络的维吾尔语事件伴随关系识别[J]. 胡伟,禹龙,田生伟,吐尔根·依布拉音,冯冠军,艾斯卡尔·艾木都拉. 中文信息学报. 2018(05)
[3]司法大数据与人工智能开发的技术障碍[J]. 王禄生. 中国法律评论. 2018(02)
[4]基于神经网络的片段级中文命名实体识别[J]. 王蕾,谢云,周俊生,顾彦慧,曲维光. 中文信息学报. 2018(03)
[5]信息抽取研究综述[J]. 郭喜跃,何婷婷. 计算机科学. 2015(02)
[6]基于层叠隐马尔可夫模型的中文命名实体识别[J]. 俞鸿魁,张华平,刘群,吕学强,施水才. 通信学报. 2006(02)
[7]实体关系自动抽取[J]. 车万翔,刘挺,李生. 中文信息学报. 2005(02)
硕士论文
[1]基于深度学习的中文信息抽取研究[D]. 姜猛.贵州大学 2019
[2]司法文书法律要素提取方法的研究与实现[D]. 王林木.东南大学 2018
本文编号:3692512
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3692512.html
最近更新
教材专著