当前位置:主页 > 文艺论文 > 语言艺术论文 >

现代维吾尔语虚词识别研究

发布时间:2017-09-02 11:37

  本文关键词:现代维吾尔语虚词识别研究


  更多相关文章: 维吾尔语虚词 语料库 识别


【摘要】:随着计算机的普及和互联网的迅猛发展,人类已经迈入了信息化社会,无论是在维吾尔语还是在其他语言中处理何种类型的数据都离不开计算机的使用。维吾尔语研究已成为信息处理领域热门话题。随着计算技术的快速发展,从最早的文字处理研究慢慢转向了自然语言处理的各个层面中。在此研究过程中所有的信息处理和研究都在词层面上进行的。现代维吾尔语中词可以分为实词和虚词两大类。实词具有同时表示词汇语义和语法语义的功能。因此,独自充当句子成分;虚词只能表示语法语义,它没有表示词汇语义功能。因此,它依附于实词之后,专门表示相应的语法功能。维吾尔语中虚词主要包括后置词、连词、语气词和感叹词等四种。维吾尔语中的同一个虚词,有时候可能扮演着既不同又特殊的角色,因而出现歧义性问题。歧义性的存在会大大降低维吾尔语虚词识别准确率,同时对句子的生成语义理解等方面产生负面影响。因此,消歧是维吾尔语虚词研究中的重要内容之一。论文的主要内容包括以下几个方面:1.本文对维吾尔语虚词自动识别研究过程中,主要对小学维吾尔文语文教教材中的所有的词和虚词进行详细而全面的研究。为了满足维吾尔语虚词信息化的需求,本文构建了较为完善的维吾尔语虚词电子语料库。2.从传统语言学角度来对维吾尔语虚词语法、语义结构进行分析,并构建了维吾尔语虚词识别规则库和虚词消歧规则库。根据计算语言学的理论技术和方法,设计并实现一个从文本中识别出维吾尔语虚词,并且能提供语法语义标注、语义解释等一系列信息的维吾尔语虚词自动识别系统。3.本系统在维吾尔语虚词识别过程中分成了四个子模块,各个模块包含着查询和统计功能,有效的减少从文本中识别维吾尔语虚词所需的时间,并且对以后的维吾尔语虚词研究领域中提供了一定的技术平台,在自然语言理解和处置中广泛运用,最重要的是弥补了虚词识别研究方面的空白。4.本文为提高虚词识别准确率,通过对小学维吾尔文语文不同五个年级的教材进行查询,最终识别出8539个虚词,识别准确率达到了83.50%。从而可知,本系统的实现文本分析中的舆情分析起着重要的作用,也为开展计算机理解与处理维吾尔语奠定了一个崭新的基础。
【关键词】:维吾尔语虚词 语料库 识别
【学位授予单位】:新疆师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:H215
【目录】:
  • 中文摘要3-4
  • Abstract4-7
  • 第1章 绪论7-14
  • 1.1 研究背景及意义7-9
  • 1.1.1 研究背景7-8
  • 1.1.2 研究意义8-9
  • 1.2 国内外虚词研究发展现状9-10
  • 1.2.1 国外研究现状9
  • 1.2.2 国内研究现状9-10
  • 1.2.3 区内研究现状10
  • 1.3 研究内容与研究思路10-12
  • 1.3.1 研究内容10-11
  • 1.3.2 研究思路11-12
  • 1.4 本文特色与创新之处12
  • 1.5 论文组织结构和工作内容12-14
  • 第2章 现代维吾尔语虚词识别相关理论研究14-22
  • 2.1 维吾尔语词的相关理论14-15
  • 2.2 维吾尔语虚词研究15-21
  • 2.2.1 虚词的概念及功能15-20
  • 2.2.2 虚词的识别研究20-21
  • 2.2.3 虚词的自动识别方法研究21
  • 2.3 本章小结21-22
  • 第3章 现代维吾尔语虚词识别规则研究22-29
  • 3.1 维吾尔语虚词识别规则基础22
  • 3.2 维吾尔语虚词识别规则研究22-26
  • 3.2.1 后置词识别规则研究22-23
  • 3.2.2 连词识别规则研究23-25
  • 3.2.3 语气词识别规则研究25-26
  • 3.2.4 感叹词识别规则研究26
  • 3.3 歧义规则的处理研究26-27
  • 3.4 语言资源建设研究27-28
  • 3.4.1 语料库语言学27-28
  • 3.4.2 语料资源选取的原则28
  • 3.5 本章小结28-29
  • 第4章 现代维吾尔语虚词识别系统设计与实现29-36
  • 4.1 需求分析29
  • 4.2 系统开发环境与工具29-31
  • 4.2.1 Visual Studio .NET集成开发环境29-30
  • 4.2.2 C#语言简介30
  • 4.2.3 数据库工具30-31
  • 4.3 系统功能能及目标31
  • 4.3.1 系统功能31
  • 4.3.2 系统目标31
  • 4.4 维吾尔语虚词识别系统设计思路和总体框架31-34
  • 4.4.1 文本预处理模块32-33
  • 4.4.2 维吾尔语虚词自动识别模块33
  • 4.4.3 消歧模块33
  • 4.4.4 统计模块33-34
  • 4.5 维吾尔语虚词识别系统功能实现34-35
  • 4.5.1 系统流程图介绍34
  • 4.5.2 系统运行界面34-35
  • 4.5.3 系统运行结果35
  • 4.6 本章小结35-36
  • 第5章 实验结果分析研究36-38
  • 5.1 维吾尔词汇统计实验结果分析36-37
  • 5.2 维吾尔语虚词自动识别的实验及结果分析37-38
  • 5.2.1 实验方案37
  • 5.2.2 实验结果37
  • 5.2.3 实验结果分析37-38
  • 第6章 结论与展望38-40
  • 6.1 研究工作总结38-39
  • 6.2 研究工作的展望39-40
  • 参考文献40-43
  • 攻读硕士学位期间参加的项目43-44
  • 攻读硕士学位期间发表的论文44-45
  • 致谢45

【参考文献】

中国期刊全文数据库 前10条

1 张坤丽;昝红英;柴玉梅;韩英杰;赵丹;;现代汉语虚词用法知识库建设综述[J];中文信息学报;2015年03期

2 卓玛吉;安见才让;;藏文不自由虚词的自动识别研究[J];商;2014年05期

3 高定国;扎西加;赵栋材;;计算机识别藏语虚词的方法研究[J];中文信息学报;2014年01期

4 昝红英;张静杰;娄鑫坡;;汉语虚词用法在依存句法分析中的应用研究[J];中文信息学报;2013年05期

5 阿里甫·库尔班;吾买尔江·库尔班;房鼎益;;维吾尔语框架语义角色标注标记集研究[J];中文信息学报;2013年02期

6 赵栋材;;基于虚词切分的藏文分词系统的设计与实现[J];西藏大学学报(自然科学版);2012年02期

7 三盘俄日;安见才让;;基于规则的不自由虚词校对算法研究[J];信息与电脑(理论版);2012年07期

8 高德立;;C#开发数据库应用系统技术实现问题[J];信息安全与技术;2011年10期

9 玉素甫·艾白都拉;张海军;艾孜尔古丽;;信息处理用现代维吾尔语词干词类标记集研究[J];信息技术与标准化;2011年06期

10 董华荣;李玉琪;;维吾尔语后置词研究评析[J];新疆职业大学学报;2010年06期

中国博士学位论文全文数据库 前3条

1 钱韧韧;现代汉语虚词与现代汉语诗歌研究[D];华中师范大学;2014年

2 哈斯;蒙古语名词词汇语义网的构建[D];内蒙古大学;2013年

3 冯秋香;基于数据库语义学的古汉语句法语义分析研究[D];大连理工大学;2012年

中国硕士学位论文全文数据库 前7条

1 卓玛吉;藏文虚词自动识别研究[D];青海民族大学;2014年

2 李芳艾;面向对外汉语的虚词语料库建设研究[D];湖南师范大学;2014年

3 迪丽达尔·迪力沙提;小学维吾尔语文(普通)教材中人称动词研究[D];新疆师范大学;2013年

4 张静杰;虚词用法自动识别及其在依存句法分析中的应用研究[D];郑州大学;2013年

5 梁猛杰;基于虚词用法的偏误检测识别研究[D];郑州大学;2013年

6 周溢辉;基于规则与统计的语气词用法自动识别研究[D];郑州大学;2011年

7 麦热甫阿依·吾斯曼;察哈台维吾尔语虚词研究(后置词、连词、语气词)[D];新疆大学;2006年



本文编号:778363

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/778363.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3d768***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com