蒙汉英语言知识库的构建
发布时间:2017-04-08 14:06
本文关键词:蒙汉英语言知识库的构建,由笔耕文化传播整理发布。
【摘要】:通过本研究,构建了蒙汉英语言知识库。论文中主要介绍了“蒙汉英词典”数据库、蒙古语词法变化形式库、多语句对齐语料库的构建工作以及建库平台、蒙汉英语言知识库用户界面的研发等内容。“蒙汉英词典”数据库,共收录20551条记录,设置了词形、音标、读音、结构、词性、语义类、对译语、与别的库连接的连接数字等方面的25个属性字段。蒙古语词法变化形式库,共有2442960条记录。记录为“蒙汉英词典”数据库所收录记录的词法变化形式。共设置了序号、词根、词根词性、词法变化形式等10个属性字段。该库记录是通过制定规则,用程序自动生成的。多语句对齐语料库是以两种形式构建的,分别为文本文件库和Access 2007数据库。共收录了4174对蒙汉单向句级对齐句子和25000个多向句级对齐的蒙、汉、英句子。句子选自当代正式出版物。以Access 2007数据库形式构建的语料库,共设置了序号、蒙古语句子、汉语句子、英语句子、来源出版物等9个属性字段。构建蒙汉英语言知识库的目的有三个:一、为蒙古语母语教学和第二语言教学提供工具,为汉语、英语等第二语言教学提供资源。二、为蒙古语跨语言检索提供语言知识。三、为机器翻译提供机器词典和对齐语料库。出于以上目的,同一个表述对象设置了几个属性字段,比如音标,设有2个属性字段,即内蒙古大学制定的拉丁转写形式和“蒙古文正字法词典(修订本)”所使用的拉丁转写形式。建库平台由词性标注、复合词类别标注、词法变化形式生成、与语料库连接的连接数字、与词法变化形式库连接的连接数字、词形生成、建立语料库单词索引等功能模块组成。这些功能模块都用于构建数据库,所以把它命名为建库平台。蒙汉英语言知识库用户界面是为了给用户提供方便而构建的。它具有精确查询和模糊查询功能,查询词可以用蒙科立蒙古文输入法输入,也可以用微软蒙古文输入法输入,或用内大拉丁形式录入。显示项为基里尔蒙古文、汉文、英文、同形词、同音词、同根词、同语义类词、语法变化、例句、名词术语等。可以显示全部,也可以显示一项或多项。本论文,也介绍了构建数据库时遇到的问题及其解决的方法。
【关键词】:蒙汉英语言知识库 蒙汉英词典 多语对齐语料库 蒙古语词法变化形式 用户界面
【学位授予单位】:内蒙古大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:H030
【目录】:
- 摘要5-7
- 中文摘要7-9
- 英文摘要9-11
- 目录11-15
- 正文15-142
- 参考文献142-151
- 附件151-160
【参考文献】
中国期刊全文数据库 前3条
1 S·苏雅拉图;蒙古文整词计算机生成理论研究[J];中文信息学报;2001年04期
2 张素芳;;国外跨语言信息检索中的翻译歧义性问题研究综述[J];图书馆学研究;2006年06期
3 郭华伟;张帆;杨小敏;侯露露;;英汉平行语料库在跨语言信息检索中的应用分析[J];医学信息学杂志;2012年03期
中国硕士学位论文全文数据库 前1条
1 扎丽玛;英汉蒙电子词典计算机查询软件的设计与实现[D];内蒙古师范大学;2006年
本文关键词:蒙汉英语言知识库的构建,由笔耕文化传播整理发布。
,本文编号:293000
本文链接:https://www.wllwen.com/shoufeilunwen/rwkxbs/293000.html