《蒙古语语法信息词典构形附加成分分库》的设计与实现
本文关键词:《蒙古语语法信息词典构形附加成分分库》的设计与实现,,由笔耕文化传播整理发布。
【摘要】:《蒙古语语法信息词典》是面向计算机的,为实现自动分析和自动生成蒙古语语句而研制的一部电子词典,是蒙古文信息处理领域重要基础工程之一。《蒙古语语法信息词典构形附加成分分库》是根据蒙古语自身语法特点和规律的最具特色的成果。研制《分库》的主要目的是为计算机自动分析和自动生成蒙古语词法形态提供所需知识。 本文在传统语法研究成果的基础上,运用计算语言学理论与方法,分析和归纳蒙古语构形附加成分的各种语法属性,使其更加具体化,设计出易于机器处理的各种属性字段及其取值规格,附在每个构形附加成分后面。《分库》共有297个记录,总共设置了正字、正音、词法、句法、语义等方面的42个属性字段,并填写了相关值,与《蒙古语语法信息词典总库》相辅相成,形成一个知识体系。 论文的结构与内容:引论部分介绍了此项研究的对象、意义、方法与资料来源;第一章说明了《分库》的研制基础与收录原则;第二章阐述了《分库》的属性字段与取值规格,附加成分重叠特征及其模型;第三章归纳了构形附加成分切分、还原规则;第四章阐释了《分库》在蒙古文信息处理中的应用;最后是简短的总结。附录1为符号说明和面向信息处理的蒙古语标记集,附录2为《分库》样本。
【关键词】:蒙古语 语法信息词典 构形附加成分 语法属性字段 规则 分库
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:H212
【目录】:
- 引论8-10
- 一、研究对象8-9
- 二、研究意义9
- 三、研究方法与资料来源9-10
- 第一章 《分库》的研制基础与收录原则10-12
- 一、《分库》的研制基础10
- 二、《分库》的收录原则与具体策略10-12
- 第二章 《分库》的语法属性字段12-22
- 一、《分库》属性概述12-13
- 二、《分库》中的属性字段与取值规格13-19
- 三、构形附加成分重叠使用特征及其模型19-22
- 四、有关属性字段后续工作22
- 第三章 构形附加成分切分、还原规则集22-31
- 一、通用还原规则23
- 二、复数附加成分切分规则23-25
- 三、格、领属及附属附加成分切分规则25-27
- 四、级附加成分切分规则27
- 五、数词附加成分切分规则27-28
- 六、静词类动态词尾“N”的切分规则28-29
- 七、动词附加成分切分、还原规则29-30
- 八、构形附加成分歧义30-31
- 第四章 《分库》的应用31-33
- 一、“蒙古语语料切分标注软件”中的应用31-32
- 二、其它应用32-33
- 结语33
- 致谢33-34
- 参考文献34-35
- 攻读学位期间发表的学术论文目录35-36
- 附录136-41
- 符号说明36
- 面向信息处理的蒙古语标记集36-41
- 附录241-45
- 《蒙古语语法信息词典构形附加成分分库》样本41-45
【引证文献】
中国期刊全文数据库 前1条
1 淑琴;那顺乌日图;;“蒙古文同音同形同类词”知识库的构建[J];中央民族大学学报(哲学社会科学版);2010年04期
中国重要会议论文全文数据库 前3条
1 通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 那顺乌日图;雪艳;叶嘉明;;现代蒙古语语料库加工技术的新进展——新一代蒙古语词语自动切分与标注系(Darhan Tagging System)[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
3 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前4条
1 淑琴;蒙古文同形词知识库的构建[D];内蒙古大学;2010年
2 林八鸽;《蒙古语连接形式知识库》的建设[D];内蒙古大学;2009年
3 牧仁高娃;蒙古语语音识别相关问题研究[D];内蒙古大学;2013年
4 通拉嘎;基于蒙古文语料库的人名自动识别[D];中央民族大学;2013年
中国硕士学位论文全文数据库 前6条
1 包艳花;蒙古文识别文本后处理相关技术研究[D];内蒙古大学;2007年
2 图格木勒;蒙古语语言资源库建设相关技术研究[D];内蒙古大学;2007年
3 呼日乐吐什;蒙古语语言知识库管理平台的设计与实现[D];内蒙古大学;2010年
4 李慧;蒙古语语义知识词典的研究与实现[D];内蒙古大学;2012年
5 白喜文;中国蒙古文信息处理技术发展历程研究[D];内蒙古师范大学;2012年
6 宝美荣;融入形态学分析的汉蒙统计机器翻译研究[D];内蒙古师范大学;2012年
本文关键词:《蒙古语语法信息词典构形附加成分分库》的设计与实现,由笔耕文化传播整理发布。
本文编号:396086
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/396086.html