融合多种语言学特征的维吾尔语神经网络命名实体识别
发布时间:2021-09-28 19:21
命名实体识别是自然语言处理中的基础任务,有着非常重要的作用。随着深度学习在自然语言处理中的深入研究,研究者发现使用神经网络进行命名实体识别、自动抽取特征,可以取得很好的识别效果。但是命名实体识别是和语言相关的,维吾尔语的复杂形态特征,导致神经网络不能全面地自动抽取特征。提出一种融合多种语言学特征的Bi-LSTM-CNN-CRF神经网络模型,在维吾尔语命名实体语料库中进行验证,最终F1值提高了3.98%,充分说明对于复杂形态语言,添加语言学特征能够提高命名实体识别精度。
【文章来源】:计算机应用与软件. 2020,37(05)北大核心
【文章页数】:6 页
【部分图文】:
CNN抽取字符特征
联合特征表示
循环神经网络(Recurrent neural network,RNN)的网络结构在自然语言处理中得到了广泛的应用。对于命名实体任务来说,RNN的输入层就是词向量,输出层就是命名实体类别序列。RNN网络有一个很大的缺点就是长期依赖问题,对于过长的神经网络序列,很难保留很久之前的输入信息。为了解决这个问题,Hochreither等设计了长短期记忆网络(Long short term merroy,LSTM),通过三个特殊的门结构来控制输入和输出信息。图3为一个LSTM单元的基本结构。LSTM更新公式如下:
【参考文献】:
期刊论文
[1]基于深度神经网络的维吾尔文命名实体识别研究[J]. 王路路,艾山·吾买尔,吐尔根·依布拉音,买合木提·买买提,卡哈尔江·阿比的热西提. 中文信息学报. 2019(03)
[2]基于CRF和半监督学习的维吾尔文命名实体识别[J]. 王路路,艾山·吾买尔,买合木提·买买提,卡哈尔江·阿比的热西提,吐尔根·依布拉音. 中文信息学报. 2018(11)
[3]基于BiLSTM-CNN-CRF模型的维吾尔文命名实体识别[J]. 买买提阿依甫,吾守尔·斯拉木,帕丽旦·木合塔尔,杨文忠. 计算机工程. 2018(08)
[4]CRF与规则相结合的维吾尔文地名识别研究[J]. 买合木提·买买提,卡哈尔江·阿比的热西提,艾山·吾买尔,吐尔根·依布拉音,王路路. 中文信息学报. 2017(06)
[5]基于模糊匹配与音字转换的维吾尔语人名识别[J]. 热合木·马合木提,于斯音·于苏普,张家俊,宗成庆,艾斯卡尔·艾木都拉. 清华大学学报(自然科学版). 2017(02)
[6]维吾尔语数词类命名实体的识别与翻译[J]. 张磊,杨雅婷,米成刚,李晓. 计算机应用与软件. 2015(08)
[7]基于词干提取的维吾尔语事件类时间短语识别[J]. 邹岳琳,吐尔根·依布拉音,麦热哈巴·艾力,艾山·吾买尔,帕力旦·吐尔逊. 计算机工程与设计. 2014(02)
[8]维吾尔语中汉族人名的识别及翻译[J]. 李佳正,刘凯,麦热哈巴·艾力,吕雅娟,刘群,吐尔根·依布拉音. 中文信息学报. 2011(04)
[9]基于规则的维吾尔人名汉文机器翻译算法研究[J]. 衣马木艾山·阿布都力克木,吐尔地·托合提,艾斯卡尔·艾木都拉. 计算机应用与软件. 2010(08)
硕士论文
[1]汉—维时间数字和量词的识别与翻译研究[D]. 阿依古丽·哈力克.新疆大学 2017
[2]基于神经网络的中文命名实体识别研究[D]. 王蕾.南京师范大学 2017
[3]基于深度学习的中文命名实体识别研究[D]. 隋臣.浙江大学 2017
[4]维吾尔语文本信息中人名实体识别研究[D]. 塔什甫拉提·尼扎木丁.新疆大学 2016
[5]维吾尔语时间表达式识别研究[D]. 邹岳琳.新疆大学 2014
本文编号:3412435
【文章来源】:计算机应用与软件. 2020,37(05)北大核心
【文章页数】:6 页
【部分图文】:
CNN抽取字符特征
联合特征表示
循环神经网络(Recurrent neural network,RNN)的网络结构在自然语言处理中得到了广泛的应用。对于命名实体任务来说,RNN的输入层就是词向量,输出层就是命名实体类别序列。RNN网络有一个很大的缺点就是长期依赖问题,对于过长的神经网络序列,很难保留很久之前的输入信息。为了解决这个问题,Hochreither等设计了长短期记忆网络(Long short term merroy,LSTM),通过三个特殊的门结构来控制输入和输出信息。图3为一个LSTM单元的基本结构。LSTM更新公式如下:
【参考文献】:
期刊论文
[1]基于深度神经网络的维吾尔文命名实体识别研究[J]. 王路路,艾山·吾买尔,吐尔根·依布拉音,买合木提·买买提,卡哈尔江·阿比的热西提. 中文信息学报. 2019(03)
[2]基于CRF和半监督学习的维吾尔文命名实体识别[J]. 王路路,艾山·吾买尔,买合木提·买买提,卡哈尔江·阿比的热西提,吐尔根·依布拉音. 中文信息学报. 2018(11)
[3]基于BiLSTM-CNN-CRF模型的维吾尔文命名实体识别[J]. 买买提阿依甫,吾守尔·斯拉木,帕丽旦·木合塔尔,杨文忠. 计算机工程. 2018(08)
[4]CRF与规则相结合的维吾尔文地名识别研究[J]. 买合木提·买买提,卡哈尔江·阿比的热西提,艾山·吾买尔,吐尔根·依布拉音,王路路. 中文信息学报. 2017(06)
[5]基于模糊匹配与音字转换的维吾尔语人名识别[J]. 热合木·马合木提,于斯音·于苏普,张家俊,宗成庆,艾斯卡尔·艾木都拉. 清华大学学报(自然科学版). 2017(02)
[6]维吾尔语数词类命名实体的识别与翻译[J]. 张磊,杨雅婷,米成刚,李晓. 计算机应用与软件. 2015(08)
[7]基于词干提取的维吾尔语事件类时间短语识别[J]. 邹岳琳,吐尔根·依布拉音,麦热哈巴·艾力,艾山·吾买尔,帕力旦·吐尔逊. 计算机工程与设计. 2014(02)
[8]维吾尔语中汉族人名的识别及翻译[J]. 李佳正,刘凯,麦热哈巴·艾力,吕雅娟,刘群,吐尔根·依布拉音. 中文信息学报. 2011(04)
[9]基于规则的维吾尔人名汉文机器翻译算法研究[J]. 衣马木艾山·阿布都力克木,吐尔地·托合提,艾斯卡尔·艾木都拉. 计算机应用与软件. 2010(08)
硕士论文
[1]汉—维时间数字和量词的识别与翻译研究[D]. 阿依古丽·哈力克.新疆大学 2017
[2]基于神经网络的中文命名实体识别研究[D]. 王蕾.南京师范大学 2017
[3]基于深度学习的中文命名实体识别研究[D]. 隋臣.浙江大学 2017
[4]维吾尔语文本信息中人名实体识别研究[D]. 塔什甫拉提·尼扎木丁.新疆大学 2016
[5]维吾尔语时间表达式识别研究[D]. 邹岳琳.新疆大学 2014
本文编号:3412435
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/3412435.html