基于BiLSTM-CRF的司法领域实体识别研究
发布时间:2024-04-14 08:48
司法信息自动化是司法领域发展的必然趋势,而司法实体识别是实现司法信息自动化的基础,是后续实现司法事件抽取,构建司法领域知识图谱的必要前提,具有重要的研究意义。目前,随着自然语言处理技术的不断发展,实体识别领域的研究也越来越成熟,但由于中文字符的特殊性以及司法领域对准确性要求非常高等原因,面向司法领域的实体识别研究比较少。对此,提出一种基于深度学习的模型来自动识别裁判文书中的实体,该模型由双向长短期记忆模型(BiLSTM)和条件随机场模块(CRF)组成,将该模型称为BiLSTM-CRF,为了进一步提升模型实体识别的准确率,提出使用Adam优化器对模型进行优化。使用从裁判文书网上获取的减刑案件、假释案件及暂予监外执行案件的裁判文书作为数据集对该模型进行验证。在对比实验中首先将该模型的实验结果与其他实体识别模型进行对比,然后使用不同优化算法优化模型以证明Adam优化器的有效性。实验表明,带Adam优化器的BiLSTM-CRF模型在数据集上能够取得最优的结果,准确率为0.876,召回率为0.858,F1值为0.855。实验结果证明带Adam优化器的BiLSTM-CRF模型在司法领域实体识别上的...
【文章页数】:6 页
【部分图文】:
本文编号:3954419
【文章页数】:6 页
【部分图文】:
图1本文实现司法实体识别方法总览
基于此,本文提出了一种基于BiLSTM-CRF[15-17]网络模型的司法实体识别方法,并采用Adam优化器对模型进行优化。基于BiLSTM-CRF的网络模型除了能够保留基于深度学习方法的优点,将字符作为基本的处理单位,对每个字符分配类别标记外,还引入了一些约束条件,避免了基....
图2LSTM单元工作流程
针对这个问题,长短期记忆模型(LongShort-TermMemory,LSTM)[19]被提出,LSTM模型实际上是RNN模型的一种改进模型。LSTM模型及LSTM单元工作流程如图2所示,该模型利用门机制改变传送到细胞状态的信息来保持信息传递的持久性,从而能够学到长距离上下....
图3BiLSTM-CRF模型
CRF一般用于计算整个序列的联合概率。CRF的参数化形式定义如下:式中,tk,δl是特征函数,λk,μl为相应的权重,Zx是规范因子。上式指根据输入序列x,得到输出序列y的条件概率。tk是定义在边上的特征函数,称为转移特征,依靠当前词及前一个词判断是否符合该特征,由当前位置及前一....
本文编号:3954419
本文链接:https://www.wllwen.com/falvlunwen/gongjianfalunwen/3954419.html