蒙古语谓语信息数据库的构建
发布时间:2021-06-13 05:11
论文运用短语结构语法、格语法等现代语言学理论,对蒙古语句子的结构语义信息进行了标注加工。在此基础上构建了蒙古语谓语信息数据库并完成初步的相关统计研究。首先,对《100万词级现代蒙古语语料库》句子长度做了统计分析。其次,出于蒙古文信息处理的具体需求,选取长度在3到20词之间的5000条简单句,标注了固定短语、词法、短语、语义分类、句子成分、语义角色等6种信息标记。通过5000条句子的标注,构建了《蒙古语谓语信息数据库》。最后运用谓语信息数据库,统计分析了蒙古语谓语的词类特征、词法变化形式特征、短语分类及其关系特征、词数特征和语义类特征,完成了对蒙古语谓语信息的初步统计研究。论文结构和主要内容如下:导论部分,主要介绍了本项研究的意义、研究现状、研究理论与方法、语料来源和标记说明。第一张介绍了选取句子来源、句子统计规则、句子选取标准和句子标注规则。第二章介绍了谓语信息数据库构建过程和相关字段属性。第三章对实际语料做了词性、词法、短语分类及其关系、词数、语义类等谓语相关信息做了5项统计分析。结论部分总结了全文并提出了下一步研究任务。
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:340 页
【学位级别】:硕士
【文章目录】:
内容摘要
ABSTRACT
目录
正文
参考文献
附录
本文编号:3227065
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:340 页
【学位级别】:硕士
【文章目录】:
内容摘要
ABSTRACT
目录
正文
参考文献
附录
本文编号:3227065
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/3227065.html