基于深度学习的二句式非充盈态汉语复句的关系识别
发布时间:2021-09-28 02:51
汉语复句的关系识别是对分句间语义关系的甄别,是复句语义分析的关键,旨在从文本中识别句间的关系类型。对于复句关系类型识别的研究有助于推动机器翻译、智能问答、自动生成文摘等领域的发展,进而提高其整体性能。由于汉语复句中非充盈态有标复句的关系标记不能够显性的表明复句所含的关系类型,所以,给此类复句的语义关系识别任务造成了困难。而本文将展开对非充盈态复句关系类别识别的研究。现有的较为主流的复句关系识别方法主要有两种,一种是基于语言学规则的,该方法主要是由语言学家针对大量的语料文本归纳总结的约束条件,并且建立的相应规则库。而另一种则是利用统计学方法,在大规模语料库中提取出复句的词面、字面上的特征,从而构建基于语料文本的特征工程。然而,这些方法所得到的特征集泛化性能较差,以至于识别的正确率不高。另外,特征的工程量较大,需耗费大量的人工和时间。为了能够深度地挖掘复句的特征集和复句蕴含的语义信息特征以及捕获到复句内分句间相互作用的语义关联信息,本文首次将深度学习方法应用到汉语复句语义关系处理中,并引入词嵌入模型对复句进行单词建模。本文所做的工作有:首先,本文采用从《长江日报》和《人民日报》以及部分当代...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图1.4基于深度学习的复句关系识别方法的模型流程图??如上图所示,利用深度学习的方法对句子建模,首先将输入的句子进行分词,??,
关系标记库主要是由关系标记以及关系标记之间所存在的搭配关系所构成??的语料数据库。关系标记即为关系词,关系词在整个复句中扮演着重要的角色,??其起着连接复句分句的作用,对复句的语义关系有着显性和隐性的标识作用。因??此,关系词在复句关系类别识别任务中是不可忽视的重要特征。复句的关系标记??和关系类别往往不是一对一的关系,其存在着“一对多”和“多对一”的关系映??射,一种关系标记可以标识多种关系类别,即在不同语境下呈现不同的关系类别。??同样,一种关系类别可以由多个关系标记进行标识。如图2.1所示,针对大规模??语料的筛选和统计,得到关系标记以及所属关系类别的范畴,并且包含关系标记、??词类、单用或是搭配组合等属性特征,构建了所有关系标记包含的属性字段特征,??具体如图2.1所示。??□?id?wordl?word2?juli?kind?num??□?224?可卫?3二哽=?0?舌杲??□?225?瑢受?B之萣与?0?、11??□?226?@乎?5今立使馬?〇?区杲?11??□^227?不箨?桩立使司?〇?转折?12??□?228?有鉴子迸?钱立度月?〇?区哭?11??□?229?是?孩立萣甲?u?12??□?230?淮知运?独立使弔?0?转折?12??□?231?唯猝?独立使葙?〇?转折?12??□?232?惟狨?狨之使与?〇?转折?12??□?233?无奈?独立便司?〇?转折?12??□?234?怎奈?v=-lS=?〇?耔?。?12??□?235?可笮?独之便.司?〇?转折?12??□?236?只可节?
士学位论文??MASTKR'S?THESIS??90.000??_。|?-…?-??70.000? ̄????60.000?????50.000?????40.000? ̄????30.000?-??■?■???20.000?-??■?■?■???:thd—JLln]??并?递?目?因?连?转假让?假条推?a??列?进?的?果?货?折转步?设件断?》??图2.4?12类关系标记出现频次??根据上图显示,并列关系、转折关系出现的频率最多,之后便是递进和因果??关系,由于递进关系隶属于并列关系,因此可得出现频次最多的关系类别为并列、??因果、转折关系类型。这也恰恰印证了由邢福义先生所提出复句的三分系统即复??句关系类别的三分法:并列类别、转折类别、因果类别。因此,这也是本文使用??该三大类作为分类结果的原因所在。本文中MNCST语料库几种关系类别的分布??情况如表2.2所示:??表2.2三大关系类别分布??关系类型?|总计? ̄ ̄比例??因果大类?3224?24.40%??并列大类?7960?60.24%??转折大类?2031?15.37%??2.4相关研究方法和实现技术??2.?4.?1?CNN?和?BI-LSTM??卷积神经网络(Convolutional?Neura丨?Network,CNN)最早由?Hubei?和?Wiesel1"]??在20世纪60年代提出,经过几十年的发展目前CNN已经被广泛应用于多个领??域中,其最初被应用于图像处理145],目标检测甚至医药发现等相关领域。??近年来,在自然语言处理领域中己得到了部分应用,并且取得了较
【参考文献】:
期刊论文
[1]基于多任务双向长短时记忆网络的隐式句间关系分析[J]. 田文洪,高印权,黄厚文,黎在万,张朝阳. 中文信息学报. 2019(05)
[2]二句式非充盈态有标复句关系类别的自动标志[J]. 杨进才,陈忠忠,沈显君,胡金柱. 计算机应用研究. 2017(10)
[3]汉语复句信息处理研究二十年[J]. 吴锋文. 中文信息学报. 2015(01)
[4]《语法修辞讲话》[J]. 吕叔湘,朱德熙. 中国科技术语. 2014(05)
[5]基于清华汉语树库的复句关系词识别与分类研究[J]. 李艳翠,孙静,周国栋,冯文贺. 北京大学学报(自然科学版). 2014(01)
[6]基于规则的连用关系标记的自动标识研究[J]. 胡金柱,陈江曼,杨进才,舒江波,雷利利. 计算机科学. 2012(07)
[7]基于关系标记的汉语复句分类研究[J]. 吴锋文. 汉语学报. 2011(03)
[8]基于词性信息自动识别和标注非分句[J]. 李琼,李志. 长春工程学院学报(社会科学版). 2011(01)
[9]汉语复句关系词库的建设及其利用[J]. 胡金柱,吴锋文,李琼,舒江波. 语言科学. 2010(02)
[10]面向中文信息处理的复句关系词提取算法研究[J]. 胡金柱,舒江波,姚双云,周星,吴锋文,肖升. 计算机工程与科学. 2009(10)
硕士论文
[1]汉语复句关系自动判定研究[D]. 洪鹿平.南京师范大学 2008
本文编号:3411101
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图1.4基于深度学习的复句关系识别方法的模型流程图??如上图所示,利用深度学习的方法对句子建模,首先将输入的句子进行分词,??,
关系标记库主要是由关系标记以及关系标记之间所存在的搭配关系所构成??的语料数据库。关系标记即为关系词,关系词在整个复句中扮演着重要的角色,??其起着连接复句分句的作用,对复句的语义关系有着显性和隐性的标识作用。因??此,关系词在复句关系类别识别任务中是不可忽视的重要特征。复句的关系标记??和关系类别往往不是一对一的关系,其存在着“一对多”和“多对一”的关系映??射,一种关系标记可以标识多种关系类别,即在不同语境下呈现不同的关系类别。??同样,一种关系类别可以由多个关系标记进行标识。如图2.1所示,针对大规模??语料的筛选和统计,得到关系标记以及所属关系类别的范畴,并且包含关系标记、??词类、单用或是搭配组合等属性特征,构建了所有关系标记包含的属性字段特征,??具体如图2.1所示。??□?id?wordl?word2?juli?kind?num??□?224?可卫?3二哽=?0?舌杲??□?225?瑢受?B之萣与?0?、11??□?226?@乎?5今立使馬?〇?区杲?11??□^227?不箨?桩立使司?〇?转折?12??□?228?有鉴子迸?钱立度月?〇?区哭?11??□?229?是?孩立萣甲?u?12??□?230?淮知运?独立使弔?0?转折?12??□?231?唯猝?独立使葙?〇?转折?12??□?232?惟狨?狨之使与?〇?转折?12??□?233?无奈?独立便司?〇?转折?12??□?234?怎奈?v=-lS=?〇?耔?。?12??□?235?可笮?独之便.司?〇?转折?12??□?236?只可节?
士学位论文??MASTKR'S?THESIS??90.000??_。|?-…?-??70.000? ̄????60.000?????50.000?????40.000? ̄????30.000?-??■?■???20.000?-??■?■?■???:thd—JLln]??并?递?目?因?连?转假让?假条推?a??列?进?的?果?货?折转步?设件断?》??图2.4?12类关系标记出现频次??根据上图显示,并列关系、转折关系出现的频率最多,之后便是递进和因果??关系,由于递进关系隶属于并列关系,因此可得出现频次最多的关系类别为并列、??因果、转折关系类型。这也恰恰印证了由邢福义先生所提出复句的三分系统即复??句关系类别的三分法:并列类别、转折类别、因果类别。因此,这也是本文使用??该三大类作为分类结果的原因所在。本文中MNCST语料库几种关系类别的分布??情况如表2.2所示:??表2.2三大关系类别分布??关系类型?|总计? ̄ ̄比例??因果大类?3224?24.40%??并列大类?7960?60.24%??转折大类?2031?15.37%??2.4相关研究方法和实现技术??2.?4.?1?CNN?和?BI-LSTM??卷积神经网络(Convolutional?Neura丨?Network,CNN)最早由?Hubei?和?Wiesel1"]??在20世纪60年代提出,经过几十年的发展目前CNN已经被广泛应用于多个领??域中,其最初被应用于图像处理145],目标检测甚至医药发现等相关领域。??近年来,在自然语言处理领域中己得到了部分应用,并且取得了较
【参考文献】:
期刊论文
[1]基于多任务双向长短时记忆网络的隐式句间关系分析[J]. 田文洪,高印权,黄厚文,黎在万,张朝阳. 中文信息学报. 2019(05)
[2]二句式非充盈态有标复句关系类别的自动标志[J]. 杨进才,陈忠忠,沈显君,胡金柱. 计算机应用研究. 2017(10)
[3]汉语复句信息处理研究二十年[J]. 吴锋文. 中文信息学报. 2015(01)
[4]《语法修辞讲话》[J]. 吕叔湘,朱德熙. 中国科技术语. 2014(05)
[5]基于清华汉语树库的复句关系词识别与分类研究[J]. 李艳翠,孙静,周国栋,冯文贺. 北京大学学报(自然科学版). 2014(01)
[6]基于规则的连用关系标记的自动标识研究[J]. 胡金柱,陈江曼,杨进才,舒江波,雷利利. 计算机科学. 2012(07)
[7]基于关系标记的汉语复句分类研究[J]. 吴锋文. 汉语学报. 2011(03)
[8]基于词性信息自动识别和标注非分句[J]. 李琼,李志. 长春工程学院学报(社会科学版). 2011(01)
[9]汉语复句关系词库的建设及其利用[J]. 胡金柱,吴锋文,李琼,舒江波. 语言科学. 2010(02)
[10]面向中文信息处理的复句关系词提取算法研究[J]. 胡金柱,舒江波,姚双云,周星,吴锋文,肖升. 计算机工程与科学. 2009(10)
硕士论文
[1]汉语复句关系自动判定研究[D]. 洪鹿平.南京师范大学 2008
本文编号:3411101
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3411101.html