当前位置:主页 > 科技论文 > 软件论文 >

否定信息识别研究

发布时间:2021-03-06 07:42
  否定是存在于所有语言中一种复杂的语言现象,能对句子或词语包含的语义信息进行反转。越来越多的自然语言处理任务需要从文本信息中挖掘出有价值的信息,否定的存在将会导致挖掘到无用甚至完全相反含义的信息,对任务的性能产生消极影响。因此,需要对否定信息进行识别,将文本信息中肯定信息与否定信息分离,并进一步识别出否定的作用范围,从而获得句子表达的正确含义,同时也能提升情感分析、信息检索、信息抽取等任务的性能。本文主要围绕汉语和英语的否定触发词识别任务、否定覆盖域识别展开了以下工作:1)使用双向长短期记忆网络结合条件随机场为模型对汉语和英语分别进行否定触发词识别和否定覆盖域识别。该模型能够克服条件随机场严重依赖人工提取特征的缺点和双向长短期记忆网络没有从全局考虑标签序列的缺点,仅以预训练的词向量作为输入进行否定触发词识别,在此基础上添加标准触发词特征进行否定覆盖域识别。实验证明:在汉语和英语语料上,基于该模型的否定触发词识别和否定覆盖域识别都获得了较好的实验结果,并且该模型在英语语料的生物医学领域不同文本之间具有较强的泛化能力。2)融合自注意力机制进行否定覆盖域识别。针对否定覆盖域较长时难以识别完整的... 

【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

否定信息识别研究


图2.1条件随机场模型

模型图,随机场,模型,条件


重庆大学硕士学位论文2理论基础9图2.2链式条件随机场模型Fig2.2LinearChainConditionalRandomFieldsmodel链式CRF模型在处理序列标注问题时,对相邻标签之间建立了联系,它在输出Y序列时,考虑了整个Y序列在X条件下的概率,并将概率最大的Y序列作为输出的预测序列,因此链式CRF不仅能学习到输入的特征,还能从标签之间学习到隐藏的关系,提高模型对序列标注问题的识别能力。但是和所有统计机器学习模型一样,它需要的输入是特征,特征提取的数目和质量将会极大的影响到模型的效果,并且特征的提取耗费时间和人力且人力上要求需要具备相关知识。2.1.2标准RNN模型循环神经网络(RecurrentNeuralNetwork,RNN)模型和普通网络相比具有“记忆”的能力,是专门用于处理具有时序性数据问题的深度学习模型。RNN的基本形式如图2.3所示。图2.3循环神经网络按时间步展开Fig2.3RNNexpandsbytimestep

序列,神经网络,序列,模型


重庆大学硕士学位论文2理论基础9图2.2链式条件随机场模型Fig2.2LinearChainConditionalRandomFieldsmodel链式CRF模型在处理序列标注问题时,对相邻标签之间建立了联系,它在输出Y序列时,考虑了整个Y序列在X条件下的概率,并将概率最大的Y序列作为输出的预测序列,因此链式CRF不仅能学习到输入的特征,还能从标签之间学习到隐藏的关系,提高模型对序列标注问题的识别能力。但是和所有统计机器学习模型一样,它需要的输入是特征,特征提取的数目和质量将会极大的影响到模型的效果,并且特征的提取耗费时间和人力且人力上要求需要具备相关知识。2.1.2标准RNN模型循环神经网络(RecurrentNeuralNetwork,RNN)模型和普通网络相比具有“记忆”的能力,是专门用于处理具有时序性数据问题的深度学习模型。RNN的基本形式如图2.3所示。图2.3循环神经网络按时间步展开Fig2.3RNNexpandsbytimestep

【参考文献】:
期刊论文
[1]基于双向LSTM网络的不确定和否定作用范围识别[J]. 钱忠,李培峰,周国栋,朱巧明.  软件学报. 2018(08)
[2]否定信息识别研究综述[J]. 唐凡,伍星.  计算机工程与应用. 2017(12)
[3]面向自然语言文本的否定性与不确定性信息抽取[J]. 邹博伟,钱忠,陈站成,朱巧明,周国栋.  软件学报. 2016(02)
[4]否定句的情感不确定性度量及分类[J]. 张志飞,苗夺谦,聂建云,岳晓冬.  计算机研究与发展. 2015(08)
[5]否定与不确定信息抽取研究综述[J]. 邹博伟,周国栋,朱巧明.  中文信息学报. 2015(04)

硕士论文
[1]基于深度学习的汉语否定信息识别研究[D]. 唐凡.重庆大学 2017
[2]汉语否定与不确定信息识别研究[D]. 陈站成.苏州大学 2014



本文编号:3066700

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3066700.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户03bd3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com