面向司法领域的罪名自动预测方法研究
发布时间:2021-11-09 20:08
近年来,人工智能技术与司法领域的交叉融合,受到了学界和业界的广泛关注。司法人工智能的引入,有利于提升司法部门的工作效率,降低司法服务的应用门槛,促进司法公正公开透明。罪名自动预测是司法人工智能的核心任务之一,其旨在依据犯罪事实自动预测出犯罪主体触犯的罪名。本文面向司法领域,对罪名自动预测方法进行了研究,主要工作及成果如下:(1)针对不同案件情形下词语语义重要性存在差异的问题,提出了一种基于语义差异性的犯罪事实文本表示方法。该方法在编码阶段利用双向门控循环单元和自注意力机制,实现了词语的上下文信息融合以及语义重要性的自动计算赋值。实验表明,该方法从词语语义差异性的角度改进了犯罪事实的表示效果,并有效提升了罪名预测性能,在CAIL2018数据集上的Funion值达到了88.0%。(2)针对罪名预测中一个被告对应多个罪名的预测问题,提出了一种面向数罪并罚情形的罪名预测方法。该方法利用问题转化思想将数罪并罚预测转化为多标签文本分类问题,并使用二元关联策略将多标签罪名分解成多个独立的单标签罪名,通过Sigmoid分类器实现每个罪名的0/1二元分类。实验表明,该方法能有效地解...
【文章来源】:山西大学山西省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
基于词语语义差异性的多标签罪名预测模型GAC
各罪名类别存在严重的数据不均衡问题,因此容易导致模型训练偏置,而分类器是以总体分类性能作为学习目标,势必会导致分类器过于关注多数样本,使得少数样本分类精度下降。本文也尝试使用上下采样算法改进模型,但该类方法对性能的提升极为有限,本文将在后续工作研究有效的改进思路。为了检验本章方法对相似、相关罪名的区分能力并进一步分析文本建模过程中注意力机制的作用机理,本文选取相似罪名“容留他人吸毒罪”与“贩卖毒品罪”中的两个案例,对其犯罪事实中各词语对应隐层向量的注意力权值进行可视化。结果如图3.2所示,可以看出,尽管“容留他人吸毒罪”与“贩卖毒品罪”均为毒品犯罪类罪名,但其犯罪事实整体语义侧重仍有所差异。依据司法解释,“容留他人吸毒罪”客观方面表现为容留他人吸食、注射毒品,重点强调主观容留性,忽略其是否存在有偿交易。而“贩卖毒品罪”更多强调毒品的交易行为,毒品种类、交易数量、毒资金额是其关键特征。因此,在“容留他人吸毒罪”案件的可视化图中,“容留”、“吸食”等强调容留吸食行为词语的颜色较深;“贩卖毒品罪”中描述毒品的交易特征的词语则颜色较深,如“购买”、“交易”、“出售”、“毒资”。这种注意力分布的差异是区分两类相似罪名的关键。通用性词语如“被告人”,“李某”,“路边”等,其罪名区分能力较弱,因此对应注意力值较低。同时发现,“海洛因”“冰毒”等毒品名称的权重也较高,原因是其所指语义为“毒品”,而该语义在毒品犯罪与非毒品犯罪(如盗窃、抢劫等罪名)的区分中较为关键。值得注意的是,“在毒品贩卖罪”中出现了标签“money_1”,其是预处理过程中对金钱类数字规范化替换的结果,因为毒资金额在“毒品贩卖罪”相似罪名(如走私、运输毒品罪等)区分中较为关
第四章基于事实-法条注意力交互机制的罪名预测23第四章基于事实-法条注意力交互机制的罪名预测法律条文是定罪量刑的权威依据,而且法律条文与犯罪事实具有高度的关联性和相似性,针对性的引入法条知识有利于提升罪名预测的性能及可解释性。本章提出了一种基于事实-法条注意力交互机制的罪名预测模型,该方法基于法条和事实隐层表示的关联性实现事实部分句子权重的自动赋值,能有效降低噪声句对于整体事实篇章编码的负影响,从而使得犯罪事实整体语义表示更为精准。4.1事实-法条编码器本章所提模型总体结构如图4.1所示,主要包含以下步骤:(1)分别将事实和法条的词向量到对应的注意力序列编码器(见图4.2)中,以获取相应句子级别的事实表示和法条表示。(2)然后使用注意力交互机制计算事实中的每一句和每个法条的关联度。(3)与此同时,法条隐层表示被输入到一个“法条-罪名预测器”用以实现法条和事实的联合表示。(4)最终,以关联度作为权重计算得到篇章级别的事实表示,将被输入到全连接层和Softmax分类器以预测得到罪名标签。本节重点介绍犯罪事实和法条的编码过程。图4.1模型总体结构4.1.1事实编码器首先进行词级到句子级的犯罪事实编码,使用基于注意力机制的序列编码器实现,如图4.2所示,其主要由两部分组成:双向门控循环单元Bi-GRU和自注意力机制[18]。词向量∈经过Bi-GRU层编码得到融入了上下文信息的词语隐层表示∈2,其中是embedding维度,是hiddenstate维度。
本文编号:3485953
【文章来源】:山西大学山西省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
基于词语语义差异性的多标签罪名预测模型GAC
各罪名类别存在严重的数据不均衡问题,因此容易导致模型训练偏置,而分类器是以总体分类性能作为学习目标,势必会导致分类器过于关注多数样本,使得少数样本分类精度下降。本文也尝试使用上下采样算法改进模型,但该类方法对性能的提升极为有限,本文将在后续工作研究有效的改进思路。为了检验本章方法对相似、相关罪名的区分能力并进一步分析文本建模过程中注意力机制的作用机理,本文选取相似罪名“容留他人吸毒罪”与“贩卖毒品罪”中的两个案例,对其犯罪事实中各词语对应隐层向量的注意力权值进行可视化。结果如图3.2所示,可以看出,尽管“容留他人吸毒罪”与“贩卖毒品罪”均为毒品犯罪类罪名,但其犯罪事实整体语义侧重仍有所差异。依据司法解释,“容留他人吸毒罪”客观方面表现为容留他人吸食、注射毒品,重点强调主观容留性,忽略其是否存在有偿交易。而“贩卖毒品罪”更多强调毒品的交易行为,毒品种类、交易数量、毒资金额是其关键特征。因此,在“容留他人吸毒罪”案件的可视化图中,“容留”、“吸食”等强调容留吸食行为词语的颜色较深;“贩卖毒品罪”中描述毒品的交易特征的词语则颜色较深,如“购买”、“交易”、“出售”、“毒资”。这种注意力分布的差异是区分两类相似罪名的关键。通用性词语如“被告人”,“李某”,“路边”等,其罪名区分能力较弱,因此对应注意力值较低。同时发现,“海洛因”“冰毒”等毒品名称的权重也较高,原因是其所指语义为“毒品”,而该语义在毒品犯罪与非毒品犯罪(如盗窃、抢劫等罪名)的区分中较为关键。值得注意的是,“在毒品贩卖罪”中出现了标签“money_1”,其是预处理过程中对金钱类数字规范化替换的结果,因为毒资金额在“毒品贩卖罪”相似罪名(如走私、运输毒品罪等)区分中较为关
第四章基于事实-法条注意力交互机制的罪名预测23第四章基于事实-法条注意力交互机制的罪名预测法律条文是定罪量刑的权威依据,而且法律条文与犯罪事实具有高度的关联性和相似性,针对性的引入法条知识有利于提升罪名预测的性能及可解释性。本章提出了一种基于事实-法条注意力交互机制的罪名预测模型,该方法基于法条和事实隐层表示的关联性实现事实部分句子权重的自动赋值,能有效降低噪声句对于整体事实篇章编码的负影响,从而使得犯罪事实整体语义表示更为精准。4.1事实-法条编码器本章所提模型总体结构如图4.1所示,主要包含以下步骤:(1)分别将事实和法条的词向量到对应的注意力序列编码器(见图4.2)中,以获取相应句子级别的事实表示和法条表示。(2)然后使用注意力交互机制计算事实中的每一句和每个法条的关联度。(3)与此同时,法条隐层表示被输入到一个“法条-罪名预测器”用以实现法条和事实的联合表示。(4)最终,以关联度作为权重计算得到篇章级别的事实表示,将被输入到全连接层和Softmax分类器以预测得到罪名标签。本节重点介绍犯罪事实和法条的编码过程。图4.1模型总体结构4.1.1事实编码器首先进行词级到句子级的犯罪事实编码,使用基于注意力机制的序列编码器实现,如图4.2所示,其主要由两部分组成:双向门控循环单元Bi-GRU和自注意力机制[18]。词向量∈经过Bi-GRU层编码得到融入了上下文信息的词语隐层表示∈2,其中是embedding维度,是hiddenstate维度。
本文编号:3485953
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3485953.html