基于犯罪行为序列的法律条文预测方法
发布时间:2021-06-09 20:48
随着互联网技术和人工智能技术的飞速发展,如何将人工智能引入到司法领域得到了各大研究机构的密切关注。在传统的审判辅助工作中,主要依托的是对于独立的案情特征进行法条、量刑、罪名的确立。然而,这种情况下,案情特征的顺序容易被忽略,尤其是涉及到案件特征的时间序列、行为序列的分析时",顺序问题"可能影响最终的审判结果,如相同特征的案件可能导致审判结果的不同。对如何有效地利用这些信息提升法律条文预测的性能进行研究,用于改进在司法领域的表现,并辅助法官和律师等更加高效地进行法律判决。通过利用案情的事实描述和犯罪行为序列来预测案件涉及的相关法条,验证基于犯罪行为序列的法律条文预测的有效性。
【文章来源】:计算机工程与应用. 2019,55(22)北大核心CSCD
【文章页数】:6 页
【部分图文】:
基于犯罪行为序列的法律条文预测模型
2019,55(22)ComputerEngineeringandApplications计算机工程与应用1引言近年来,我国不断深入推进司法改革,希望通过引入人工智能,提升审判效率,提高审判能力。通过调研发现,裁判文书中的案情描述对法律条文预测结果有着显著影响。但仅仅使用案情描述进行法律条文的预测,可解释性不强,效果不佳。因此考虑引入其他类型的数据用于提高法律条文预测的可解释性及其预测结果。结合法院断案的思路,判案人员会考虑整个案件动作发生的先后顺序以及犯罪行为等信息。如图1所示:案件A,罪名为故意杀人,对应所触犯的法条为《中华人民共和国刑法》第232条。案件B,罪名为过失致人死亡,对应所触犯的法条为《中华人民共和国刑法》第233条。虽然这两个案件中涉及的动作描述相似,且最后的结果都是死亡,但动作发生的先后顺序有着明显的不同,最终也导致了这两个案件的罪名和法条的不同。这些动作的序列信息往往被人忽略,当人们将这些信息融入到法律条文预测任务中,会对法律条文的预测有着极大的帮助。因此本文提出了基于犯罪行为序列的法律条文预测方法,以法条作为要预测的标签(共有183条法律条文),预测案件所涉及的法条。而通常情况下,一个案件的案情描述是由不同的行为词按照先后顺序构成的,这些行为词可以作为案情的关键要素。因此对案情描述中的行为词提取,建立与之相对应的犯罪行为序列来表示当前案件的发展趋势。针对提取到的犯罪行为序列,选用合适的模型进行处理并用于法律条文的预测,从而解决仅仅使用案情描述这类文本信息对于法律条文预测的不足。本文针对传统法律条文预测任务仅仅使用案情描述的情况,引入犯罪行为序列的信息,丰富了案情描述的特征表现,增强了对案情描述的理解,有利于对案情描述进行深层?
褂萌??槌槿∷惴ǖ玫降鼻?案件的三元组集合,对得到的三元组集合信息进行清洗筛选的工作,并将其拼接得到犯罪行为序列,对于得到的犯罪行为序列将其转换为向量表示。考虑到TextRNN善于处理序列信息,能够更好地表达上下文信息,因此使用TextRNN对犯罪行为序列进行建模处理。对于案情描述部分,考虑到TextCNN善于捕捉局部相关性,具体到法律条文预测中,可以利用TextCNN提取更多句子中的关键信息,因此使用TextCNN对案情描述进行建模处理。最后将两个模型的结果融合并进行输出。基于犯罪行为序列的法律条文预测流程如图2所示。3.2犯罪行为序列结合司法人员案件审理的过程来看,司法人员会着重考虑整个案件动作发生的先后顺序以及当前案件的犯罪行为等信息,根据抽取结果发现每一个罪名下(罪名和法条一一对应)都有一种固定的事件线描述方法,如图3所示。针对案情描述如何提取到犯罪行为序列,这里考虑利用中文语法启发式规则抽取关系表述和根据距离确定论元位置的方法进行相应的抽取工作,输出表示实体关系的三元组的集合,并将三元组的集合进行组合,从而得到犯罪行为序列。对于犯罪行为序列的捕捉,首先需要对案情描述进行依存分析,依存分析的目的是通过分析句子中各个成分之间的依赖关系,从而揭示句子的句法结构[14]。其次需要结合中文语法的关系表述来进行抽取,在英文中可以将实体之间的谓语动词作为关系表述,而在中文中以谓语动词作为关系表述容易导致实体间的关系含糊不清,同时动词谓语句的谓语是动词或者动词短语,它在日常用语中占了很大的比重,是汉语中常见的句型。动词谓语句主要分为两大类:动词作谓语,动词短语作谓语。具体到本文的应用场景,使用哈工大LTP工具,从案情的事实描述中抽取得到三元组
【参考文献】:
期刊论文
[1]基于依存分析的开放式中文实体关系抽取方法[J]. 李明耀,杨静. 计算机工程. 2016(06)
[2]审判案例自动抽取与标注模型研究[J]. 佘贵清,张永安. 现代图书情报技术. 2013(06)
[3]基于本体的法律知识库的研究与实现[J]. 何庆,汤庸,黄永钊. 计算机科学. 2007(02)
本文编号:3221290
【文章来源】:计算机工程与应用. 2019,55(22)北大核心CSCD
【文章页数】:6 页
【部分图文】:
基于犯罪行为序列的法律条文预测模型
2019,55(22)ComputerEngineeringandApplications计算机工程与应用1引言近年来,我国不断深入推进司法改革,希望通过引入人工智能,提升审判效率,提高审判能力。通过调研发现,裁判文书中的案情描述对法律条文预测结果有着显著影响。但仅仅使用案情描述进行法律条文的预测,可解释性不强,效果不佳。因此考虑引入其他类型的数据用于提高法律条文预测的可解释性及其预测结果。结合法院断案的思路,判案人员会考虑整个案件动作发生的先后顺序以及犯罪行为等信息。如图1所示:案件A,罪名为故意杀人,对应所触犯的法条为《中华人民共和国刑法》第232条。案件B,罪名为过失致人死亡,对应所触犯的法条为《中华人民共和国刑法》第233条。虽然这两个案件中涉及的动作描述相似,且最后的结果都是死亡,但动作发生的先后顺序有着明显的不同,最终也导致了这两个案件的罪名和法条的不同。这些动作的序列信息往往被人忽略,当人们将这些信息融入到法律条文预测任务中,会对法律条文的预测有着极大的帮助。因此本文提出了基于犯罪行为序列的法律条文预测方法,以法条作为要预测的标签(共有183条法律条文),预测案件所涉及的法条。而通常情况下,一个案件的案情描述是由不同的行为词按照先后顺序构成的,这些行为词可以作为案情的关键要素。因此对案情描述中的行为词提取,建立与之相对应的犯罪行为序列来表示当前案件的发展趋势。针对提取到的犯罪行为序列,选用合适的模型进行处理并用于法律条文的预测,从而解决仅仅使用案情描述这类文本信息对于法律条文预测的不足。本文针对传统法律条文预测任务仅仅使用案情描述的情况,引入犯罪行为序列的信息,丰富了案情描述的特征表现,增强了对案情描述的理解,有利于对案情描述进行深层?
褂萌??槌槿∷惴ǖ玫降鼻?案件的三元组集合,对得到的三元组集合信息进行清洗筛选的工作,并将其拼接得到犯罪行为序列,对于得到的犯罪行为序列将其转换为向量表示。考虑到TextRNN善于处理序列信息,能够更好地表达上下文信息,因此使用TextRNN对犯罪行为序列进行建模处理。对于案情描述部分,考虑到TextCNN善于捕捉局部相关性,具体到法律条文预测中,可以利用TextCNN提取更多句子中的关键信息,因此使用TextCNN对案情描述进行建模处理。最后将两个模型的结果融合并进行输出。基于犯罪行为序列的法律条文预测流程如图2所示。3.2犯罪行为序列结合司法人员案件审理的过程来看,司法人员会着重考虑整个案件动作发生的先后顺序以及当前案件的犯罪行为等信息,根据抽取结果发现每一个罪名下(罪名和法条一一对应)都有一种固定的事件线描述方法,如图3所示。针对案情描述如何提取到犯罪行为序列,这里考虑利用中文语法启发式规则抽取关系表述和根据距离确定论元位置的方法进行相应的抽取工作,输出表示实体关系的三元组的集合,并将三元组的集合进行组合,从而得到犯罪行为序列。对于犯罪行为序列的捕捉,首先需要对案情描述进行依存分析,依存分析的目的是通过分析句子中各个成分之间的依赖关系,从而揭示句子的句法结构[14]。其次需要结合中文语法的关系表述来进行抽取,在英文中可以将实体之间的谓语动词作为关系表述,而在中文中以谓语动词作为关系表述容易导致实体间的关系含糊不清,同时动词谓语句的谓语是动词或者动词短语,它在日常用语中占了很大的比重,是汉语中常见的句型。动词谓语句主要分为两大类:动词作谓语,动词短语作谓语。具体到本文的应用场景,使用哈工大LTP工具,从案情的事实描述中抽取得到三元组
【参考文献】:
期刊论文
[1]基于依存分析的开放式中文实体关系抽取方法[J]. 李明耀,杨静. 计算机工程. 2016(06)
[2]审判案例自动抽取与标注模型研究[J]. 佘贵清,张永安. 现代图书情报技术. 2013(06)
[3]基于本体的法律知识库的研究与实现[J]. 何庆,汤庸,黄永钊. 计算机科学. 2007(02)
本文编号:3221290
本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/3221290.html