面向司法案件的案情知识图谱自动构建
发布时间:2021-03-08 22:25
以法学知识为中心的认知智能是当前司法人工智能发展的重要方向。该文提出了以自然语言处理(NLP)为核心技术的司法案件案情知识图谱自动构建技术。以预训练模型为基础,对涉及的实体识别和关系抽取这两个NLP基本任务进行了模型研究与设计。针对实体识别任务,对比研究了两种基于预训练的实体识别模型;针对关系抽取任务,该文提出融合平移嵌入的多任务联合的语义关系抽取模型,同时获得了结合上下文的案情知识表示学习。在"机动车交通事故责任纠纷"案由下,和基准模型相比,实体识别的F1值可提升0.36,关系抽取的F1值提升高达2.37。以此为基础,该文设计了司法案件的案情知识图谱自动构建流程,实现了对数十万份判决书案情知识图谱的自动构建,为类案精准推送等司法人工智能应用提供语义支撑。
【文章来源】:中文信息学报. 2020,34(01)北大核心
【文章页数】:11 页
【部分图文】:
实体识别模型BERT-Softmax
f(Η,Y)= ∑ i=1 n A y i ,y i+1 + ∑ i=1 n Ρ i,y i ?????? ??? (2)其中,A是输出标签之间的转移得分矩阵,其中,Aij对应标签i到标签j的得分。
我们对句子特征、实体1特征、实体2特征进行连接,输入到前馈神经网络,进行特征融合,以获得融合特征Ffused,如式(8)所示。F fused =gelu((F sent ⊕F ent1 ⊕F ent2 )W fused +b fused )?????? ??? (8)
本文编号:3071762
【文章来源】:中文信息学报. 2020,34(01)北大核心
【文章页数】:11 页
【部分图文】:
实体识别模型BERT-Softmax
f(Η,Y)= ∑ i=1 n A y i ,y i+1 + ∑ i=1 n Ρ i,y i ?????? ??? (2)其中,A是输出标签之间的转移得分矩阵,其中,Aij对应标签i到标签j的得分。
我们对句子特征、实体1特征、实体2特征进行连接,输入到前馈神经网络,进行特征融合,以获得融合特征Ffused,如式(8)所示。F fused =gelu((F sent ⊕F ent1 ⊕F ent2 )W fused +b fused )?????? ??? (8)
本文编号:3071762
本文链接:https://www.wllwen.com/falvlunwen/gongjianfalunwen/3071762.html