当前位置:主页 > 科技论文 > 自动化论文 >

基于转移的神经网络哈萨克语句法分析研究

发布时间:2020-08-31 12:30
   句法分析作为自然语言处理中的重要部分,开展有关哈萨克语句法分析的研究工作是十分必要的。句法分析一般采用基于图的方法或者基于转移的方法,本文采用基于转移的方法对哈萨克语句法分析进行研究,基于转移的方法都需要使用缓冲区存储句子信息,使用堆栈区存储分析过后的句子信息,然后根据转移方法生成相应的动作序列,并存储在历史动作区。基于转移的方法一般包括自底向上的方法和自顶向下的方法,该方法的本质是将待分析的句法树输入后,按照一定的规则,将其转化为相应的动作序列,那么句法分析问题变成了如何预测出最佳动作序列的序列化问题。自顶向下的方法从句子的顶端开始分析,首先打开非终结符,在句子不断的分析中,将单词移入堆栈中,满足形成子树的条件后,关闭当前的非终结符,形成子树,如果打开的非终结符有误,那么不仅当前子树会出现错误,也会影响其他子树的形成。自底向上的方法分析过程中首先将终结符移入堆栈,当满足子树形成的条件后进行规约,此时对非终结符进行预测,但是自底向上的方法在捕捉句子的整体上仍有不足。针对这些不足,本文在哈萨克语句法分析研究中进行了以下三个方面的工作:1.在目前哈萨克语的句法分析研究中,基于转移的方法一般都是采用自底向上或者自顶向下的方法,本文采用基于中序遍历的转移方法,在一定程度上能够弥补自底向上和自顶向下方法的不足。2.本文将基于转移的方法与神经网络进行结合,采用三个LSTM构成的句法分析器进行句法分析。三个LSTM对应转移方法中使用到的堆栈区、缓冲区和历史动作区,在进行REDUCE动作时使用Bi-LSTM提取构建子树时的特征,三个LSTM传入一个softmax层,从而得到下一个动作的概率。3.本文采用判别模型与生成模型结合的重排序方法,通过抽样算法首先由判别模型生成一定数量的候选树,再由生成模型对候选树重新进行打分,从新的分数中选择出分数最高的句法树作为最佳结果输出。
【学位单位】:新疆大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.1;TP183
【部分图文】:

哈萨克语,句法树


法在实现时需要设定三个区域[19][20],缓冲句子放入相应的缓冲区之中,然后按照照一定的转移操作进行相应的操作,例如的内容弹出,进行操作后再推入堆栈,记相应的句法标记,然后生成以一定规则提出了 arc-standard 的基于转移的方法[21]栈来存储部分构建的语法结构和一个缓法通过分数在每个配置中选择一个动作。底向上构建的,因为头的右依赖关系仅附加,只有当所有的单词都处理完毕,并句法分析才完全结束。

句法树,自底向上,遍历,栈顶


子树将推入到堆栈 S 中成为新的栈顶中 XX 是非终端符号,例如 NP,VPXX:采用二元文法对堆栈 S 栈顶的两树将推入到堆栈 S 中成为新的栈顶元T 表示选择左侧的孩子为中心词。T-XX:采用二元文法对堆栈 S 栈顶的树将推入到堆栈 S 中成为新的栈顶元T 表示选择右侧孩子为中心词。分析方法可以看作是对句法树进行后由于哈萨克语的书写方式为从右往左采用自底向上的方法,对句法树进行头所示。

句法树,自顶向下,遍历,非终结符


吴昊[17]与陈雪[18]都采用了 Shift-Reduce 方法,是后序遍历句法树分析自顶向下的方法可以看作对句法树进行所示。其动作序列生产规则如下[23]:冲区中弹出最前面的单词,并将其压入顶部打开一个标签为 X 的非终结符。遇到一个开放的非终结符,从堆栈中弹的非终结符的标签 X 将作为构成新短语中弹出根节点并结束分析。

【相似文献】

相关期刊论文 前10条

1 杨振鹏;;依存句法分析方法综述[J];无线互联科技;2018年22期

2 杨振鹏;;基于中文宾州树库的依存句法分析器的比较[J];太原城市职业技术学院学报;2018年12期

3 王明仁;句法分析问题[J];宁夏教育;1989年03期

4 张丹;周俏丽;张桂平;;引入层次成分分析的依存句法分析[J];沈阳航空航天大学学报;2017年01期

5 邱立坤;史林林;王厚峰;;多领域中文依存树库构建与影响统计句法分析因素之分析[J];中文信息学报;2015年05期

6 吴福祥;周付根;;统一框架的混合依存句法分析[J];电子科技大学学报;2016年01期

7 朱慕华;王会珍;朱靖波;;向上学习方法改进移进-归约中文句法分析[J];中文信息学报;2015年02期

8 杨红星;谷欣;;汉语句法分析的综述[J];山西青年;2016年23期

9 魏莉;;规则和统计相结合的句法分析一致性检验[J];山西广播电视大学学报;2014年03期

10 石翠;;依存句法分析研究综述[J];智能计算机与应用;2013年06期

相关会议论文 前10条

1 李正华;车万翔;刘挺;;基于柱状搜索的高阶依存句法分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

2 李军辉;周国栋;朱巧明;钱培德;;一种改进的中文层次句法分析模型研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

3 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年

4 庞文斌;张国煊;曹恬;;基于规则和统计的汉语浅层句法分析的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

5 冀铁亮;穗志方;;词汇化概率句法分析与动词子语类框架获取的互动方法[A];第三届学生计算语言学研讨会论文集[C];2006年

6 孙宏林;俞士汶;;浅层句法分析方法概述[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年

7 段湘煜;赵军;徐波;;基于动作建模的中文依存句法分析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

8 刘海涛;;影响依存句法分析的因素探讨[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

9 马金山;刘挺;李生;;面向句法分析的句子片段识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

10 江丰;刘慧;陈玉泉;陆汝占;;一个可扩展的汉语词法和句法分析一体化系统[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

相关重要报纸文章 前3条

1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年

2 梁振华;婚恋剧的生活质感与趣味嫁接[N];文艺报;2013年

3 本报记者 霍立峰;中科院免费大餐怎么吃[N];中国高新技术产业导报;2002年

相关博士学位论文 前10条

1 马骥;面向依存句法分析优化技术的研究[D];东北大学;2015年

2 朱慕华;基于多数据源的成分句法分析研究[D];东北大学;2013年

3 李正华;汉语依存句法分析关键技术研究[D];哈尔滨工业大学;2013年

4 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年

5 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年

6 黄书剑;统计机器翻译中的词对齐研究[D];南京大学;2012年

7 周浩;基于神经网络的句法分析研究[D];南京大学;2017年

8 林锋;问题回答和对话系统中置信度的研究[D];复旦大学;2008年

9 田卫新;产品评论检索若干关键技术研究[D];武汉大学;2010年

10 徐润华;基于词语搭配知识和语法功能匹配的句法分析器[D];南京师范大学;2013年

相关硕士学位论文 前10条

1 白雅雯;基于转移的神经网络哈萨克语句法分析研究[D];新疆大学;2019年

2 柴伟;基于句子跨度的哈萨克语句法分析研究[D];新疆大学;2019年

3 刘小辉;基于CRF的哈萨克语句法分析系统设计与实现[D];新疆大学;2019年

4 刘施翌;基于深度学习的依存句法分析研究模型[D];沈阳工业大学;2019年

5 乌优坛;基于深度学习的蒙古语句法分析研究[D];内蒙古大学;2019年

6 司念文;面向军事领域的句子级文本处理技术研究[D];战略支援部队信息工程大学;2018年

7 张月;基于局部标注的依存句法分析研究[D];苏州大学;2018年

8 黄文灿;汉语复句中基于神经网络模型的依存句法分析方法研究[D];华中师范大学;2018年

9 王冰;基于深度学习的汉语句法分析研究[D];杭州电子科技大学;2018年

10 李梦叶;医学文献中疾病与病症关系抽取研究与应用[D];大连理工大学;2018年



本文编号:2808801

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2808801.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47175***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com