语义角色标注技术研究及在金融信息提取中的应用
发布时间:2021-11-23 15:52
由于近些年来计算机技术和网络通信技术的高速发展,人们对自然语言处理相关技术的需求越来越大。人们希望通过使用自然语言技术来对大量的文本进行处理以更加快速的得到有用的信息。中文信息处理是自然语言处理的一个重要的分支,在基础理论研究和技术开发应用方面获得了显著的成果。语义角色标注作为浅层语义分析的一种简单实现,是自然语言处理任务的一种,而近些年来随着深度学习技术的流行,在自然语言处理任务中使用深度学习技术成为了一种趋势。在当前自然语言处理领域,基于长短期记忆网络(Long Short-Term Memory)的深度学习算法适用于处理较长的序列并能学习到序列中长距离的依赖信息。并有效缓解RNN中会出现的梯度消失和梯度爆炸的问题,因此特别适合处理文本信息。本文主要使用了双向LSTM的神经网络模型并结合CRF(条件随机场)来作为本文的语义角色标注模型,来对本文所使用的金融语料进行标注,得到F1的最佳值为71.65%。本文主要的做的工作如下:一,选用宾州大学中文语料库中的金融相关语料,确定了18类语义角色标签,并对语料进行预处理。二、构建以词向量为输入的Bi-LSTM网络结合CRF作为语义角色模型:...
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
CPB标注语句实例
许多任务上取得了成功,相表现。但是传统的神经网路这样的网络结构称作前馈神,因为它无法处理数据之间后关联性往往也包含了重要就需要前面单词的信息,有网络却不能利用这种信息。N 这种模型的工作方式更接前文内容的基础上来推断下定向循环,它将上一时刻隐的输入,使得模型可以直接了信息的持久化。RNN 结构
图 2.3 RNN 按时间步展开图展开后的 RNN 结构与前馈神经网络很类似,但是其中的隐藏层的权值类似于卷积神经网络中的滤波器的权值在不同时间步是共享的,隐层结构 A 称为循环体。循环体 A 是模型运算的关键,对于 RNN 的改进也都是通过改进循环体 A的内部结构。下面图 2.4 展示了循环体的内部结构。图 2.4 RNN 内部循环体结构图
【参考文献】:
期刊论文
[1]基于LSTM网络的序列标注中文分词法[J]. 任智慧,徐浩煜,封松林,周晗,施俊. 计算机应用研究. 2017(05)
[2]篇章分析技术综述[J]. 徐凡,朱巧明,周国栋. 中文信息学报. 2013(03)
[3]基于依存特征的汉语框架语义角色自动标注[J]. 王智强,李茹,阴志洲,刘海静,李双红. 中文信息学报. 2013(02)
[4]基于SVM和扩展条件随机场的Web实体活动抽取[J]. 张传岩,洪晓光,彭朝晖,李庆忠. 软件学报. 2012(10)
[5]基于依存树距离识别论元的语义角色标注系统[J]. 王鑫,穗志方. 中文信息学报. 2012(02)
[6]中文名词性谓词语义角色标注[J]. 李军辉,周国栋,朱巧明,钱培德. 软件学报. 2011(08)
[7]基于特征组合的中文语义角色标注[J]. 李世奇,赵铁军,李晗静,刘鹏远,刘水. 软件学报. 2011(02)
[8]基于树状条件随机场模型的语义角色标注[J]. 李明,王亚斌,张其文,王旭阳. 计算机工程. 2010(18)
[9]基于最大熵模型的语义角色标注[J]. 于江德,王希杰,余正涛. 微电子学与计算机. 2010(08)
[10]基于依存树的中文语义角色标注[J]. 安强强,张蕾. 计算机工程. 2010(04)
博士论文
[1]基于核方法的语义角色标注研究[D]. 车万翔.哈尔滨工业大学 2008
硕士论文
[1]基于LSTM的汉语语义角色标注研究[D]. 郑亚楠.西藏大学 2017
[2]基于LSTM的语义关系分类研究[D]. 胡新辰.哈尔滨工业大学 2015
[3]基于依存图的中文语义分析[D]. 丁宇.哈尔滨工业大学 2014
[4]基于依存树核函数的语义角色标注研究[D]. 王步康.苏州大学 2012
[5]基于联合方法的中文语义角色标注研究[D]. 王文学.上海交通大学 2012
[6]基于特征的中文名词性谓词语义角色标注研究[D]. 徐靖.苏州大学 2011
[7]基于条件场的语义角色标注[D]. 颜廷义.北京邮电大学 2010
[8]基于结构学习的语义角色标注[D]. 白雪.北京邮电大学 2010
[9]基于依存分析的语义角色标注研究[D]. 汪红林.苏州大学 2009
[10]基于条件随机场的自动分词技术的研究[D]. 陈晴.东北大学 2005
本文编号:3514202
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
CPB标注语句实例
许多任务上取得了成功,相表现。但是传统的神经网路这样的网络结构称作前馈神,因为它无法处理数据之间后关联性往往也包含了重要就需要前面单词的信息,有网络却不能利用这种信息。N 这种模型的工作方式更接前文内容的基础上来推断下定向循环,它将上一时刻隐的输入,使得模型可以直接了信息的持久化。RNN 结构
图 2.3 RNN 按时间步展开图展开后的 RNN 结构与前馈神经网络很类似,但是其中的隐藏层的权值类似于卷积神经网络中的滤波器的权值在不同时间步是共享的,隐层结构 A 称为循环体。循环体 A 是模型运算的关键,对于 RNN 的改进也都是通过改进循环体 A的内部结构。下面图 2.4 展示了循环体的内部结构。图 2.4 RNN 内部循环体结构图
【参考文献】:
期刊论文
[1]基于LSTM网络的序列标注中文分词法[J]. 任智慧,徐浩煜,封松林,周晗,施俊. 计算机应用研究. 2017(05)
[2]篇章分析技术综述[J]. 徐凡,朱巧明,周国栋. 中文信息学报. 2013(03)
[3]基于依存特征的汉语框架语义角色自动标注[J]. 王智强,李茹,阴志洲,刘海静,李双红. 中文信息学报. 2013(02)
[4]基于SVM和扩展条件随机场的Web实体活动抽取[J]. 张传岩,洪晓光,彭朝晖,李庆忠. 软件学报. 2012(10)
[5]基于依存树距离识别论元的语义角色标注系统[J]. 王鑫,穗志方. 中文信息学报. 2012(02)
[6]中文名词性谓词语义角色标注[J]. 李军辉,周国栋,朱巧明,钱培德. 软件学报. 2011(08)
[7]基于特征组合的中文语义角色标注[J]. 李世奇,赵铁军,李晗静,刘鹏远,刘水. 软件学报. 2011(02)
[8]基于树状条件随机场模型的语义角色标注[J]. 李明,王亚斌,张其文,王旭阳. 计算机工程. 2010(18)
[9]基于最大熵模型的语义角色标注[J]. 于江德,王希杰,余正涛. 微电子学与计算机. 2010(08)
[10]基于依存树的中文语义角色标注[J]. 安强强,张蕾. 计算机工程. 2010(04)
博士论文
[1]基于核方法的语义角色标注研究[D]. 车万翔.哈尔滨工业大学 2008
硕士论文
[1]基于LSTM的汉语语义角色标注研究[D]. 郑亚楠.西藏大学 2017
[2]基于LSTM的语义关系分类研究[D]. 胡新辰.哈尔滨工业大学 2015
[3]基于依存图的中文语义分析[D]. 丁宇.哈尔滨工业大学 2014
[4]基于依存树核函数的语义角色标注研究[D]. 王步康.苏州大学 2012
[5]基于联合方法的中文语义角色标注研究[D]. 王文学.上海交通大学 2012
[6]基于特征的中文名词性谓词语义角色标注研究[D]. 徐靖.苏州大学 2011
[7]基于条件场的语义角色标注[D]. 颜廷义.北京邮电大学 2010
[8]基于结构学习的语义角色标注[D]. 白雪.北京邮电大学 2010
[9]基于依存分析的语义角色标注研究[D]. 汪红林.苏州大学 2009
[10]基于条件随机场的自动分词技术的研究[D]. 陈晴.东北大学 2005
本文编号:3514202
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3514202.html