当前位置:主页 > 外语论文 > 小语种论文 >

面向印尼语的依存句法分析研究

发布时间:2021-03-24 16:39
  自2013年中国与印度尼西亚确立全面战略伙伴关系以来,两国的经济合作和贸易往来愈发密切。通过收集与分析印尼国内新闻网站和社交媒体发布的信息,我们可以更深入了解印度尼西亚的国情。但这些信息多是用印度尼西亚语写成,若是有相关工具可对其进行自动处理和分析,将能为相关研究人员提供极大的便利。然而,与英语、汉语等高资源语言不同,作为非通用语言的印度尼西亚语在自然语言处理领域受到的关注远不及通用语言,导致目前面向印尼语的语言基础资源和语言处理工具非常有限。句法分析是连接自然语言处理上层应用和底层技术的一个重要纽带。然而,目前国内外在印尼语句法分析方面的研究工作较少,不仅缺乏大规模的句法树库,而且也少有较前沿的方法和模型在其上面的研究和应用。针对以上问题,本文的研究从已有的依存句法分析理论和方法出发,较深入分析了印尼语语言的特点,并借助现有的研究成果提出更符合印尼语语言特点的依存句法分析方法。具体研究内容如下:(1)基于深度学习技术的印尼语依存句法分析我们总结了常见的几种基于深度学习的依存句法分析方法,并将其应用在印尼语语料上,以验证其在印尼语上的可行性。另外,根据印尼语的语言特性,我们对公开数据集... 

【文章来源】:广东外语外贸大学广东省

【文章页数】:60 页

【学位级别】:硕士

【部分图文】:

面向印尼语的依存句法分析研究


对取自WSJ语料库的一个英文句子Thereisnoasbestosinourproductsnow.做句法分析

面向印尼语的依存句法分析研究


动作Shift

方法,栈顶,终结状态,转移系统


图 2-4 动作 Leftger 方法rc-eager 转移系统中,每个状态都由一个三元组< , , >构成,其用于存放已被遍历的词; 为一个队列结构(缓存区),用于存放句词; 代表已经建立的依存弧集合。对于要分析的句子 = ( , 为< , , >,终结状态为< , , >。该系统包含了四类动t-Arc, Reduce 和 Shift。对于栈顶词 ,当不存在词 充当其中心词存于队首词 ,此时采用动作 Left-Arc,即在两个词语间建立一条左为队首词的孩子,同时将栈顶词从栈中弹出,如图 2-5 所示。图 2-5 动作 Left-Arc

【参考文献】:
期刊论文
[1]汉英词语对齐规范[J]. 赵红梅,刘群,张瑞强,吕雅娟,隅田英一郎,吴翠玲.  中文信息学报. 2009(03)
[2]汉语句法树库标注体系[J]. 周强.  中文信息学报. 2004(04)

硕士论文
[1]柬埔寨语依存句法分析方法研究[D]. 徐璐.昆明理工大学 2017
[2]基于深度学习的自然语言句法分析研究[D]. 周青宇.哈尔滨工业大学 2016
[3]基于主动学习的汉语依存树库构建[D]. 陈鑫.哈尔滨工业大学 2011



本文编号:3098041

资料下载
论文发表

本文链接:https://www.wllwen.com/waiyulunwen/zhichangyingyu/3098041.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3c9bc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com