当前位置:主页 > 法律论文 > 司法论文 >

基于机器学习的司法案例筛选系统设计与实现

发布时间:2020-04-11 08:46
【摘要】:司法文本逻辑严谨,结构清晰明确,适合采用计算机进行分析和处理。依托于近年来司法公开的相关政策,可用的司法语料大幅度增长,为机器学习方法在司法领域的应用提供了数据支撑。为了帮助司法从业者进行快速地案例检索,同时为民众法律询提供辅助工具,本文研究并设计实现司法案例筛选系统。这一系统的核心功能是对获取的文本进行分析,并从数据库内备选的海量裁判文书中筛选出相似案例供用户参考,同时包含裁判文书分析等辅助功能。文章的主要工作是将机器学习及相关自然语言处理技术引入司法领域内。首先,本文对系统所属的司法智能领域进行了研究现状介绍。进一步,介绍了分词技术、文本关键词提取算法TF-IDF、文本分类技术fastText及web应用框架技术Django等与本文系统构建相关的技术,并完成系统设计及实现。本文拟通过机器学习技术fastText对文本进行分类,进一步依据文本分类得到的标签结果进行相似案例筛选。系统的总体设计分为四部分,包括文件上传模块、文本输入模块、裁判文书分析模块和案例筛选模块。主要完成的工作如下:采用Django框架实现裁判文书上传模块和文本输入模块,用于实现与用户之间的交互,为整个系统的获取需要分析的文本。采用关键字匹配和TF-IDF算法抽取文本关键信息,实现对上传裁判文书的分析工作,帮助用户快速理解裁判文书。采用fastText框架训练多个机器学习模型,用于对输入文本进行分类;进一步实现依据分类标签及文本相似度的筛选和排序,最后展示筛选结果并提供下载等辅助功能。司法案例筛选系统最终以web应用的形式运行良好。用户可以通过浏览器访问这一系统,进行文本输入、裁判文书上传和分析,并依据输入的文本进行相似案例的筛选。经实验,系统裁判文书解析正确率达到86%,案例筛选相关率达到81%,具有一定实用性。
【图文】:

网络结构图,学习分类,文本,隐藏层


即使是大型数据,,也能够在一台硬件配置达到当前主流水平的机器上以逡逑分钟级的时间代价训练完成P1]。训练出模型的效果与深度学习分类器相比精逡逑度差别不是很大,甚至优于部分的深度学习分类器,如图2.1所示[31]:逡逑逦Yahoo逦Amazon邋full逦Amazon邋polarity逡逑逦Accuracy逦Time逦Accuracy逦Tiae逦Accuracy逦Ti?e逡逑char-CNN邋71.2逦—邋1邋day ̄逦59.5逦^5邋days ̄逦94.5逦 ̄5邋days ̄ ̄逡逑VDCNN逦73.4逦2h逦63逦7h邋 ̄邋95.7逦7h逡逑fastText邋72,3逦5s逦60.2逦9s逦94.6逦IQs逡逑图2.1:邋fastText与深度学习对比图逡逑fastText另一特点,在于“text”。这是一个完全用于文本分类的框架。可用逡逑于句子(短文本)分类和长文本分类等领域[32],在文本倾向性和文本分类标逡逑签预测等典型问题上有着非常优异的表现。并且这一框架能够通过学习词语的逡逑向量表示来处理多种语言的文本,因而对于中文的司法文本同样适用。逡逑fastText模型主要由三部分组成[33]:浅层神经网络模型架构、层次Softmax逡逑和N-gram特征。在模型架构方面,fastText采用了与word2vec训练词向量所用逡逑的CB0W模型相似的浅层神经网络模型(如图2.2所示)。逡逑与深度神经网络隐藏层包含多层不同,fastText所采用的模型隐藏层仅有逡逑一层

用例图,用例图,远程文件,文本输入


负载|支持1位用户远程同时访问逡逑3.2.3司法案例筛选系统用例设计逡逑根据系统功能性需求,系统的用例图如图3.1所示:逡逑扩展逡逑筛选案例y逡逑7、、、.逦逦逦逦逡逑图3.1:系统用例图逡逑用例图中共涉及7个用例,分别是远程文本输入、远程文件上传、裁判文书逡逑分析、获取筛选案例、详情查看、文件下载和裁判文书储存。逡逑其中,远程文本输入用例和远程文件上传用例定义了文件上传和文本框输逡逑入两种交互功能。裁判文书分析用例定义了裁判文书分析功能:需要帮助系统逡逑使用者快速地理解裁判文书。裁判文书储存用例定义了对裁判文书及其分析结逡逑果储存的功能。获取筛选案例用例定义了案例筛选功能:需要通过用户输入或逡逑上传的文本,筛选出相似的案例文本。详情查看用例和文件下载用例分别定义逡逑了对筛选案例的原文本详情查看和下载的功能。7个用例的具体用例描述如下:逡逑17逡逑
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:D926;TP181;TP391.1

【相似文献】

相关期刊论文 前10条

1 罗书臻;;加强司法案例研究 增强案例的公信力[J];人民司法(案例);2017年23期

2 周强;;构建司法案例研究大格局 开创司法案例应用新局面[J];法律适用(司法案例);2017年16期

3 李华文;王柳;;如何写作司法案例[J];应用写作;2006年05期

4 黄进;;强化司法案例研究,促进法治中国建设[J];法律适用(司法案例);2017年08期

5 张家勇;;探索司法案例的研究方法[J];法律适用(司法案例);2017年24期

6 庄春英;;政府信息公开法律适用问题研究——以司法案例为视角[J];中国司法;2018年09期

7 ;2017年《法律适用·司法案例》总目录[J];法律适用(司法案例);2017年24期

8 周强;;加强司法案例研究 促进人民法院审判体系和审判能力现代化[J];法律适用(司法案例);2017年02期

9 ;欢迎订阅2017年《法律适用·司法案例》[J];法律适用(司法案例);2017年08期

10 ;欢迎订阅2017年《法律适用·司法案例》[J];法律适用(司法案例);2017年10期

相关会议论文 前2条

1 方芳;;大数据视角下校园安全风险类型化研究——基于2015年中小学安全事故司法案例的调查[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(下)[C];2017年

2 余聪;;指导性案例之众评式遴选模式的构建——以中国司法案例网为平台的操作分析[A];《上海法学研究》集刊(2019年第5卷 总第5卷)[C];2019年

相关重要报纸文章 前10条

1 ;最高法院2017年度司法案例研究课题立项结果[N];人民法院报;2017年

2 于同志;我们应如何研究司法案例[N];人民法院报;2018年

3 重庆市第四中级人民法院院长 孙海龙;司法案例的价值及其实现[N];人民法院报;2018年

4 宗边;着力搭建合作共享共赢的平台[N];人民法院报;2017年

5 ;司法案例工作推进会发言摘登[N];人民法院报;2017年

6 最高人民法院刑二庭 于同志;我们为什么要重视司法案例[N];人民法院报;2017年

7 中国青年报·中青在线记者 王培莲;吉大毕业生创办免费司法案例搜索引擎[N];中国青年报;2016年

8 记者 罗书臻;加强司法案例研究 促进严格公正司法[N];人民法院报;2016年

9 记者 罗书臻;中国司法案例网内网开通上线[N];人民法院报;2016年

10 孙海龙 重庆市第四中级人民法院院长 全国首届审判业务专家;完善法官案例生成与运用工作机制[N];人民法院报;2018年

相关硕士学位论文 前10条

1 秦泽民;基于机器学习的司法案例筛选系统设计与实现[D];南京大学;2019年

2 陈阳;沉默构成意思表示的基本研究[D];中国社会科学院研究生院;2017年

3 刘玉涛;论集体土地征收的公共利益要件[D];上海交通大学;2015年

4 李娇阳;公司机会规则研究[D];西南科技大学;2017年

5 李泽山;“工作”构成要素的司法认定[D];上海交通大学;2012年

6 何其芬;试论民间良俗的司法化[D];苏州大学;2009年

7 李秉祥;自由心证在民国刑事审判中的运用[D];西南政法大学;2010年

8 林志坚;清代中期对“邪教”案件的惩治[D];中央民族大学;2012年

9 郑文思;公众人物的类型化及其人格权的限制[D];中国政法大学;2011年

10 马敏;商标法“不良影响”条款适用案例研究[D];华东政法大学;2016年



本文编号:2623390

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/gongjianfalunwen/2623390.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c0ecb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com