基于深度学习的汉语三分句复句自动分析方法
发布时间:2021-08-26 10:09
汉语复句研究,属于中文信息处理中的一小类。在中文信息处理这一领域中,对于字、词等方面研究较多。但在汉语复句研究一块,尤其是三分句复句,研究较少。复句,相比于简单句,所包含的语义信息更丰富,表达形式更多样,因此具有比简单句更高的研究价值和意义。在汉语复句的分析研究任务中,二分句复句的分析研究已经取得了良好的成果,但三分句复句的分析研究仍然止步不前。其中一个重要原因就是没有相应的语料库,语料库乃复句分析研究之本。目前用于复句研究的语料数据大都来源于CCCS语料库,其中语料数据较为经典,但语料数据太过陈旧。鉴于这种情况,本文围绕着建立一个新的语料库——汉语复句关系词搭配知识库展开,具体研究工作包括以下三个方面:第一,建立一个专门用于汉语复句研究的语料库《汉语复句关系词搭配知识库》,标记其中的三分句复句;并将这些三分句复句中的关系词补全,补为充盈态三分句复句;同时记录三分句复句中的关系词、关系词搭配组合情况、层次结构与关系类别等,为后面的分析研究任务做准备;第二,复句中的关系类别是可以根据关系词确定的,由此可见,复句中的关系词对于复句研究的重要性。在汉语表达中,字词之间的界限并不是十分明确,且...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
图2.1:《汉语复句关系词搭配知识库》原始语料示例??2.3汉语三分句复句层次结构与关系类别??
,其三分句复句为非充盈态复句,该复句含有两个关系词“不光,??还,k”,k表示该分句不含有关系词;将其关系词补全后,就可以得到充盈态三??分句复句,其三个分句含有四个关系词“因为-不光,还,所以”,如例2.?5所示。??除去将三分句复句的关系词补全,成为充盈态三分句复句外,《汉语复句关??系词搭配知识库》中语料数据的标注内容还包括:分句数量、原始语料关系词、??补全为充盈态三分句复句语料后的关系词、层次结构(“2+1”式、“1+2”式、??“1+1+1”式)、关系类别等。其具体标注如图2.8所示。??论遇?IV.始讲料?扑仝讲料?朴紮办料氕系id?G次功构?Xi系纪铟???法小仪受呪场;V?埘条?.-4?r?t?A?w?nit?V)??3?(i)^*?????2?養.應??狀仅?p相伽人?强■人?、料属.??II们⑴场l:Ll仃tt丨&W丨?丨丨牝丨1/场IKi的丨丨幼啤??坫.?机监的动呦收系统役八_f?:?!.吡沏???<?Hxtm?\ti.?1.?fl!?u?v??WfTs咍奴ft统吐扣K!川,…唣fek动权吒?3?(k.?(II.?k)?(闳为>?幼軟透的1成^,;.n?^?1?imb2WUl??%?的成处!:人衫?代恥沉At丨.人各丨j,(所以)??l?U:?i.效本肽.?加1.效丰低.??仏(采川机壯wiir检#m-??加xxftt成崤胶权??硌觉的然丨r,/iUin?灼屯议冷范⑷?v?<?.??mmfhm?^?itk-?t.?z?以f?.?c??%?队.似v;侧嘯机k?a?M??fe忧丨bi;?动Uifc进丨]"flfli??免成養作牝,??图2.?8:《
规则本身也具有一定的局限性,会给实验结果带来误差。使用深度学习方法可以??很好地规避这一问题。尤其是选择合适深度学习方法与机器学习方法相结合,可??以相互补充,弥补使用单一方法带来的缺陷,使实验结果更准确。??3_2.1循环神经网络——RNN??RNN,循环神经网络,是一类专门用于处理序列数据的神经网络,包括输入??层、隐藏层、输出层等。不同于其他的祌经网络,它不仅考虑前一时刻的输入,??而且对前面的内容有一种“记忆”功能,即:一个序列的当前输出与前面的输出??也有关。其网络结构如图3.1所示。??1?I?I?I?I?1?|?|??1?Y?1?1?Vr.ll?丨?y,?I?I??a?a?n?“??(.i?—i'——h>)—kb??丫丫丫??I?X?j?XM?[?Xt?丨?XH??图3.?1:?RNN网络结构图??上图中,左侧是RNN网络结构的折叠图,右侧是RNN网络结构的展开图。??其中,/-I、/、/?+?1表示为时间序列,X表示输入,Y表示输出,表示隐藏层。??从展开图中可以看到,随着时间的推移,序列的不断推进,前面的隐藏层输出会??影响到后面的隐藏层。??3.2.2?LSTM??LSTM,长短时记忆神经网络,是一种时间循环网络,是为/解决-?般的RNN??16??
【参考文献】:
期刊论文
[1]基于子词的句子级别神经机器翻译的译文质量估计方法[J]. 李培芸,翟煜锦,项青宇,李茂西,裘白莲,罗文兵,王明文. 厦门大学学报(自然科学版). 2020(02)
[2]基于差分进化的中文情感分类集成算法研究[J]. 杨梦月,卫伟,陆慧娟,卢海峰. 计量学报. 2020(02)
[3]近三十年现代汉语复句研究成果量化分析[J]. 王梓秋. 语文学刊. 2019(06)
[4]关系标记对汉语复句层构关联的制约规则挖掘[J]. 吴锋文. 华中学术. 2019(02)
[5]关于现代汉语语法研究的思考[J]. 汪国胜. 长江学术. 2019(01)
[6]邢福义、汪国胜主编的《现代汉语》疑点辨正[J]. 胡华. 辽东学院学报(社会科学版). 2018(03)
[7]汉语复句中基于依存关系与最大熵模型的词义消歧方法研究[J]. 李源,翟宏森,刘凤娇,黄文灿,杨梦川. 计算机与数字工程. 2018(01)
[8]复句三分系统的优势及其在对外汉语教学中的运用[J]. 钟小璐. 兰州教育学院学报. 2018(01)
[9]一种基于语义关系图的词语语义相关度计算模型[J]. 张仰森,郑佳,李佳媛. 自动化学报. 2018(01)
[10]现代汉语并列类复句的认知解读[J]. 宋艳旭. 教育现代化. 2017(46)
博士论文
[1]基于深度神经网络的文本表示及其应用[D]. 户保田.哈尔滨工业大学 2016
[2]基于复杂网络的汉语复句关系词搭配依存语言网及其应用研究[D]. 胡泉.华中师范大学 2016
硕士论文
[1]基于语料库的现代汉语递进连词研究[D]. 刘佳丽.广西师范大学 2019
[2]基于依存关系与语义关联的汉语复句分句的跨度计算[D]. 王玲莉.华中师范大学 2019
[3]基于深度学习的汉语复句层次结构分析方法的应用研究[D]. 李妙.华中师范大学 2019
[4]现代汉语单复句划分纠葛现象研究[D]. 叶竹君.四川师范大学 2018
[5]汉语教学中的条件复句研究[D]. 靳晓玮.陕西师范大学 2018
[6]基于决策树的非充盈态有标复句层次结构的构造方法研究[D]. 肖宇坤.华中师范大学 2018
[7]基于决策树方法的汉语复句关系词自动识别[D]. 邹艳军.华中师范大学 2018
[8]现代汉语复句语义及预设研究[D]. 冯莉.广西师范学院 2018
[9]近代汉语选择复句研究[D]. 戚悦.苏州大学 2018
[10]基于句法模式识别的中文关系抽取方法研究与实现[D]. 郝博.电子科技大学 2017
本文编号:3364045
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
图2.1:《汉语复句关系词搭配知识库》原始语料示例??2.3汉语三分句复句层次结构与关系类别??
,其三分句复句为非充盈态复句,该复句含有两个关系词“不光,??还,k”,k表示该分句不含有关系词;将其关系词补全后,就可以得到充盈态三??分句复句,其三个分句含有四个关系词“因为-不光,还,所以”,如例2.?5所示。??除去将三分句复句的关系词补全,成为充盈态三分句复句外,《汉语复句关??系词搭配知识库》中语料数据的标注内容还包括:分句数量、原始语料关系词、??补全为充盈态三分句复句语料后的关系词、层次结构(“2+1”式、“1+2”式、??“1+1+1”式)、关系类别等。其具体标注如图2.8所示。??论遇?IV.始讲料?扑仝讲料?朴紮办料氕系id?G次功构?Xi系纪铟???法小仪受呪场;V?埘条?.-4?r?t?A?w?nit?V)??3?(i)^*?????2?養.應??狀仅?p相伽人?强■人?、料属.??II们⑴场l:Ll仃tt丨&W丨?丨丨牝丨1/场IKi的丨丨幼啤??坫.?机监的动呦收系统役八_f?:?!.吡沏???<?Hxtm?\ti.?1.?fl!?u?v??WfTs咍奴ft统吐扣K!川,…唣fek动权吒?3?(k.?(II.?k)?(闳为>?幼軟透的1成^,;.n?^?1?imb2WUl??%?的成处!:人衫?代恥沉At丨.人各丨j,(所以)??l?U:?i.效本肽.?加1.效丰低.??仏(采川机壯wiir检#m-??加xxftt成崤胶权??硌觉的然丨r,/iUin?灼屯议冷范⑷?v?<?.??mmfhm?^?itk-?t.?z?以f?.?c??%?队.似v;侧嘯机k?a?M??fe忧丨bi;?动Uifc进丨]"flfli??免成養作牝,??图2.?8:《
规则本身也具有一定的局限性,会给实验结果带来误差。使用深度学习方法可以??很好地规避这一问题。尤其是选择合适深度学习方法与机器学习方法相结合,可??以相互补充,弥补使用单一方法带来的缺陷,使实验结果更准确。??3_2.1循环神经网络——RNN??RNN,循环神经网络,是一类专门用于处理序列数据的神经网络,包括输入??层、隐藏层、输出层等。不同于其他的祌经网络,它不仅考虑前一时刻的输入,??而且对前面的内容有一种“记忆”功能,即:一个序列的当前输出与前面的输出??也有关。其网络结构如图3.1所示。??1?I?I?I?I?1?|?|??1?Y?1?1?Vr.ll?丨?y,?I?I??a?a?n?“??(.i?—i'——h>)—kb??丫丫丫??I?X?j?XM?[?Xt?丨?XH??图3.?1:?RNN网络结构图??上图中,左侧是RNN网络结构的折叠图,右侧是RNN网络结构的展开图。??其中,/-I、/、/?+?1表示为时间序列,X表示输入,Y表示输出,表示隐藏层。??从展开图中可以看到,随着时间的推移,序列的不断推进,前面的隐藏层输出会??影响到后面的隐藏层。??3.2.2?LSTM??LSTM,长短时记忆神经网络,是一种时间循环网络,是为/解决-?般的RNN??16??
【参考文献】:
期刊论文
[1]基于子词的句子级别神经机器翻译的译文质量估计方法[J]. 李培芸,翟煜锦,项青宇,李茂西,裘白莲,罗文兵,王明文. 厦门大学学报(自然科学版). 2020(02)
[2]基于差分进化的中文情感分类集成算法研究[J]. 杨梦月,卫伟,陆慧娟,卢海峰. 计量学报. 2020(02)
[3]近三十年现代汉语复句研究成果量化分析[J]. 王梓秋. 语文学刊. 2019(06)
[4]关系标记对汉语复句层构关联的制约规则挖掘[J]. 吴锋文. 华中学术. 2019(02)
[5]关于现代汉语语法研究的思考[J]. 汪国胜. 长江学术. 2019(01)
[6]邢福义、汪国胜主编的《现代汉语》疑点辨正[J]. 胡华. 辽东学院学报(社会科学版). 2018(03)
[7]汉语复句中基于依存关系与最大熵模型的词义消歧方法研究[J]. 李源,翟宏森,刘凤娇,黄文灿,杨梦川. 计算机与数字工程. 2018(01)
[8]复句三分系统的优势及其在对外汉语教学中的运用[J]. 钟小璐. 兰州教育学院学报. 2018(01)
[9]一种基于语义关系图的词语语义相关度计算模型[J]. 张仰森,郑佳,李佳媛. 自动化学报. 2018(01)
[10]现代汉语并列类复句的认知解读[J]. 宋艳旭. 教育现代化. 2017(46)
博士论文
[1]基于深度神经网络的文本表示及其应用[D]. 户保田.哈尔滨工业大学 2016
[2]基于复杂网络的汉语复句关系词搭配依存语言网及其应用研究[D]. 胡泉.华中师范大学 2016
硕士论文
[1]基于语料库的现代汉语递进连词研究[D]. 刘佳丽.广西师范大学 2019
[2]基于依存关系与语义关联的汉语复句分句的跨度计算[D]. 王玲莉.华中师范大学 2019
[3]基于深度学习的汉语复句层次结构分析方法的应用研究[D]. 李妙.华中师范大学 2019
[4]现代汉语单复句划分纠葛现象研究[D]. 叶竹君.四川师范大学 2018
[5]汉语教学中的条件复句研究[D]. 靳晓玮.陕西师范大学 2018
[6]基于决策树的非充盈态有标复句层次结构的构造方法研究[D]. 肖宇坤.华中师范大学 2018
[7]基于决策树方法的汉语复句关系词自动识别[D]. 邹艳军.华中师范大学 2018
[8]现代汉语复句语义及预设研究[D]. 冯莉.广西师范学院 2018
[9]近代汉语选择复句研究[D]. 戚悦.苏州大学 2018
[10]基于句法模式识别的中文关系抽取方法研究与实现[D]. 郝博.电子科技大学 2017
本文编号:3364045
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3364045.html