基于法律要素的相似案例推荐关键技术研究
发布时间:2022-01-23 12:21
随着数字化存储的法律案件文本数量的激增,法务工作者和普通大众可以更轻松的对这些资料进行查阅,但从这些文本中检索到有用的信息也会耗费大量时间,因此设计算法准确地查找信息非常有意义,相似案例推荐就是其中很重要的一环。本文提出了一个基于图嵌入的无监督法律文本表示算法,该算法结合了案件文本中包含的法律要素信息和文本的语义信息。首先抽取出每个案例所包含的法律要素,然后,在每一个法律要素维度生成一张子图,节点为每一个案件,边代表两个案件包含该要素。进一步地,利用图嵌入算法为每个案例生成每一个法律要素维度的向量表示,最后将不同维度的向量表示进行汇集,形成一个单独的向量来表示文本,利用该向量来计算任意两个案件的相似度。考虑到不同法律要素的重要性程度不同,但法律法规中没有明确的规定不同要素的重要性,因此,在汇集多个维度法律要素向量表示的时候,本文利用判决结果作为标签训练模型,使得模型能够学习到不同要素之间的权重信息,利用这些权重信息得到一个文本的最终向量表示,进而计算案件的相似度。由于相似案例的认定在法律领域没有严格的规定,即没有一个充要条件来定义两个案例的相似性,并且在刑事类案件领域缺乏权威的相似案例...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
word2vec两种常用模型
哈尔滨工业大学工学硕士学位论文18下面本文以键值对的查询为例,给出注意力机制的具体定义,其具体过程如图2-8所示。给定一个查询问题Query,以及与之相关联的键值对映射(Key-Value),其中Query,Key和Value都是向量。那么attention值的计算可以分为三个步骤。首先计算每一个Query与Key的相似程度,此处有三种不同的计算方式,第一种是点积法,其计算公式如式2-20所示:(,)=(2-20)其中,(,)表示查询和第个关键字的相似程度。第二种是通用法,其计算公式如式2-21所示:(,)=(2-21)其中,是一个可以训练的权重矩阵。还有一种是感知机法,其计算公式如式2-22所示:(,)=tanh(+)(2-22)+1212(,)1212*+*+*…………图2-8注意力机制归一化处理
哈尔滨工业大学工学硕士学位论文23况。上述两个部分的合并是作为寻找相似案例的输入。值得一提的是,有些判决文书中,由于法院审理查明的案件事实和公诉机关指控的事实相同,为了书写简单,便不会再写明经审理查明一段,而是在判决文书中明确表示公诉机关的起诉内容真实可靠,予以采纳。由于这种情况比较常见,在这里本文特意指明,这种情况下,文本在采用数据的时候就会采集公诉机关指控部分的数据,作为案情描述的部分。3.2法律案件要素分析在考虑两个案件是否相似时,实际上是在考虑两个案件中所包含的法律要素是否相似,这些法律要素往往体现在被告人的行为上,是用于判定被告人是否触犯某些法律法规,以及应该判处何种罪名,刑期时间长短的关键要素,对于不同类型的案件,往往有着不同的法律要素需要考虑,即每一种罪名对应着不同的法律要素。考虑到法律领域数据集的因素,本文使用的数据集全都是我国的刑事类案件,因此本文主要针对我国刑事类案件进行建模。在大量阅读刑事类案件判决文书并请教相应领域专家之后,本文分析得出我图3-2案例判决文书式样
【参考文献】:
期刊论文
[1]司法类案的判断标准及其运用[J]. 高尚. 法律科学(西北政法大学学报). 2020(01)
[2]基于主题模型的法院文本典型案例推荐[J]. 吕宾,侯伟亮. 微电子学与计算机. 2018(02)
[3]基于SimHash算法的案件辅助判决系统研究[J]. 李锐,游景扬,刘稳,王锦,陈建峡. 湖北工业大学学报. 2017(05)
[4]论类似案件的判断[J]. 张骐. 中外法学. 2014(02)
[5]一种改进的基于向量空间文本相似度算法的研究与实现[J]. 李连,朱爱红,苏涛. 计算机应用与软件. 2012(02)
[6]基于VSM的文本相似度计算的研究[J]. 郭庆琳,李艳梅,唐琦. 计算机应用研究. 2008(11)
硕士论文
[1]句子级和段落级的语义相似度算法的设计与实现[D]. 王明阳.北京邮电大学 2019
[2]面向法律案例检索的文档相似度计算研究[D]. 李兰君.南京师范大学 2018
[3]基于深度学习的司法智能研究[D]. 邓文超.哈尔滨工业大学 2017
[4]基于自然语义处理的裁判文书推荐系统设计与实现[D]. 向李兴.南京大学 2015
本文编号:3604337
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
word2vec两种常用模型
哈尔滨工业大学工学硕士学位论文18下面本文以键值对的查询为例,给出注意力机制的具体定义,其具体过程如图2-8所示。给定一个查询问题Query,以及与之相关联的键值对映射(Key-Value),其中Query,Key和Value都是向量。那么attention值的计算可以分为三个步骤。首先计算每一个Query与Key的相似程度,此处有三种不同的计算方式,第一种是点积法,其计算公式如式2-20所示:(,)=(2-20)其中,(,)表示查询和第个关键字的相似程度。第二种是通用法,其计算公式如式2-21所示:(,)=(2-21)其中,是一个可以训练的权重矩阵。还有一种是感知机法,其计算公式如式2-22所示:(,)=tanh(+)(2-22)+1212(,)1212*+*+*…………图2-8注意力机制归一化处理
哈尔滨工业大学工学硕士学位论文23况。上述两个部分的合并是作为寻找相似案例的输入。值得一提的是,有些判决文书中,由于法院审理查明的案件事实和公诉机关指控的事实相同,为了书写简单,便不会再写明经审理查明一段,而是在判决文书中明确表示公诉机关的起诉内容真实可靠,予以采纳。由于这种情况比较常见,在这里本文特意指明,这种情况下,文本在采用数据的时候就会采集公诉机关指控部分的数据,作为案情描述的部分。3.2法律案件要素分析在考虑两个案件是否相似时,实际上是在考虑两个案件中所包含的法律要素是否相似,这些法律要素往往体现在被告人的行为上,是用于判定被告人是否触犯某些法律法规,以及应该判处何种罪名,刑期时间长短的关键要素,对于不同类型的案件,往往有着不同的法律要素需要考虑,即每一种罪名对应着不同的法律要素。考虑到法律领域数据集的因素,本文使用的数据集全都是我国的刑事类案件,因此本文主要针对我国刑事类案件进行建模。在大量阅读刑事类案件判决文书并请教相应领域专家之后,本文分析得出我图3-2案例判决文书式样
【参考文献】:
期刊论文
[1]司法类案的判断标准及其运用[J]. 高尚. 法律科学(西北政法大学学报). 2020(01)
[2]基于主题模型的法院文本典型案例推荐[J]. 吕宾,侯伟亮. 微电子学与计算机. 2018(02)
[3]基于SimHash算法的案件辅助判决系统研究[J]. 李锐,游景扬,刘稳,王锦,陈建峡. 湖北工业大学学报. 2017(05)
[4]论类似案件的判断[J]. 张骐. 中外法学. 2014(02)
[5]一种改进的基于向量空间文本相似度算法的研究与实现[J]. 李连,朱爱红,苏涛. 计算机应用与软件. 2012(02)
[6]基于VSM的文本相似度计算的研究[J]. 郭庆琳,李艳梅,唐琦. 计算机应用研究. 2008(11)
硕士论文
[1]句子级和段落级的语义相似度算法的设计与实现[D]. 王明阳.北京邮电大学 2019
[2]面向法律案例检索的文档相似度计算研究[D]. 李兰君.南京师范大学 2018
[3]基于深度学习的司法智能研究[D]. 邓文超.哈尔滨工业大学 2017
[4]基于自然语义处理的裁判文书推荐系统设计与实现[D]. 向李兴.南京大学 2015
本文编号:3604337
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3604337.html
最近更新
教材专著