当前位置:主页 > 科技论文 > 软件论文 >

蒙汉英多语种词典资源管理平台的设计与实现

发布时间:2019-04-04 12:21
【摘要】:本文以传统蒙古文、西里尔蒙古文、汉文和英文的多语种对照资源库为对象,搭建了蒙汉英多语种词典资源管理平台。平台的资源库涵盖了目前主流的传统蒙古文-汉文、西里尔蒙古文-汉文、传统蒙古文-英文和西里尔蒙古文-英文等30多个词典,对照词总条数达到近150多万。该多语种资源库的建立为蒙古文自然语言处理提供了基础资源,并对蒙古语言文字的保护与传承具有重大意义。本资源管理平台主要有根据不同语种查询词条解释、资源库的综合管理与维护功能,使得该资源库的管理和使用更加方便、准确。因为对照词库的词条数量较多,所以本文对资源库建立了索引来提升检索的效率。本资源管理平台针对于查询功能模块,采用了一种B+树的数据结构来对传统蒙古文-汉文、西里尔蒙古文-汉文、传统蒙古文-英文和西里尔蒙古文-英文等词典建立索引。B+树索引是数据库中常用的一种索引技术,B+树索引支持顺序查找和随机查找,因此通过B+树的索引算法有效提高了词典查询效率。由于蒙古文属于黏着语,所以本文根据蒙古文的构词特点对传统蒙古文进行了词干后缀切分处理,使得传统蒙古文的查询更加准确有效。系统中传统蒙古文的默认排序功能与平时的蒙古文字母排序顺序有所区别,因此本文建立了基于规则的传统蒙古文排序系统,并应用在传统蒙古文的检索结果和资源管理维护中。
[Abstract]:The resource management platform of Mongolian-English multilingual dictionary is set up in this paper, which is based on the multi-language control resource base of traditional Mongolian, Cyrmund, Chinese and English. The resource bank of the platform covers more than 30 dictionaries, such as traditional Mongolian-Chinese, Cyrillic Mongolian-Chinese, traditional Mongolian-English and Cyrillic Mongolian-English. The total number of control words is more than 1.5 million. The establishment of this multilingual resource database provides the basic resources for Mongolian natural language processing and has great significance for the protection and inheritance of Mongolian language and characters. This resource management platform mainly has the function of comprehensive management and maintenance according to different languages, which makes the management and use of the resource database more convenient and accurate. Because of the large number of entries in the reference database, the index of the database is established to improve the efficiency of retrieval. In view of the query function module, this resource management platform adopts a B-tree data structure to the traditional Mongolian-Chinese, Cyrillic-Chinese, Traditional Mongolian-English and Cyrillic-English dictionaries are indexed. B-tree index is a commonly used index technology in database. B-tree index supports sequential search and random search. Therefore, the efficiency of dictionary query is improved effectively by the index algorithm of B-tree. Because Mongolian belongs to adhesive language, this paper deals with the stem suffix segmentation of the traditional Mongolian according to the characteristics of Mongolian word formation, which makes the traditional Mongolian query more accurate and effective. The default sort function of traditional Mongolian in the system is different from the order of Mongolian alphabetical order, so the traditional Mongolian sorting system based on rules is established in this paper. And applied in the traditional Mongolian retrieval results and resource management and maintenance.
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.52

【相似文献】

相关期刊论文 前10条

1 朝克;《蒙古文编码》已由内蒙古大学出版社出版[J];内蒙古大学学报(人文社会科学版);2000年06期

2 红梅,敖其尔,白云莉;托忒蒙古文读音输入法的设计与实现[J];内蒙古师范大学学报(自然科学汉文版);2004年02期

3 乌日娜;;清代蒙古文历史文献及其整理研究概况[J];兰台世界;2011年19期

4 嘎日迪,赵小兵,马红旭,赛音,白小玲;蒙古文自动处理系统研究[J];中文信息学报;1999年04期

5 菊花;金良;;使用程序自动分析蒙古文词的研究[J];内蒙古师范大学学报(自然科学汉文版);2014年02期

6 乌林西拉;内蒙古自治区图书馆学(蒙古文)的研究与发展[J];国家图书馆学刊;2000年01期

7 S·苏雅拉图;蒙古文整词计算机生成理论研究[J];中文信息学报;2001年04期

8 朝克图;关于蒙古文报刊史研究中的几个问题[J];蒙古学信息;2001年04期

9 红梅;基于Windows 2000/XP平台蒙古文输入法的设计技术[J];内蒙古师范大学学报(自然科学汉文版);2005年01期

10 巩政;郝莉;杨旭华;;非标准蒙古文字符编码转换为国际编码的一种方法[J];内蒙古大学学报(自然科学版);2008年02期

相关会议论文 前10条

1 包艳花;图格木勒;;多字体印刷蒙古文识别后处理研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

2 吉仁尼格;;蒙古文同形词的统计法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

3 呼斯勒;六月;斯日古楞;;浅谈蒙古文通用编辑器几点基本规范[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

4 道布;;回鹘式蒙古文[A];中国民族古文字[C];1982年

5 道布;;回鹘式蒙古文研究概况[A];中国民族古文字研究[C];1980年

6 白双成;胡其图;木仁;;蒙古文音节切分算法实现及其应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

7 孟和吉雅;白音门德;敖其尔;田会利;;蒙古文语音合成技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

8 孟和吉雅;敖其尔;巩政;;蒙古文网页制作技术分析[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年

9 确精扎布;;蒙古文编码国际标准通过以后研制的几种蒙古文录入系统比较[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年

10 宝金良;;蒙古文文本标点符号及其属性字段设置[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年

相关重要报纸文章 前10条

1 记者 吉儒木图;手机可以使用蒙古文了[N];内蒙古日报(汉);2007年

2 记者 解太荣;《蒙古秘史》回鹘体蒙古文复原项目完成[N];锡林郭勒日报;2009年

3 孟克;如何打破蒙古文图书产销两难的困境[N];中国民族报;2010年

4 记者 阿斯钢;蒙古国总统签命令推广回鹘式蒙古文[N];新华每日电讯;2010年

5 记者 苏布达;全盟首届蒙古文图书节落幕[N];锡林郭勒日报(汉);2012年

6 陈岗龙 (蒙古族);蒙古文文学翻译的两个问题[N];文艺报;2013年

7 金坛;蒙古文:描绘大自然的千姿百态[N];中国民族报;2014年

8 阿勒得尔图;沙日布却玛:用回鹘体蒙古文还原《蒙古秘史》[N];中国民族报;2006年

9 记者 张文强;蒙古文图书农牧民阅读大接力活动启动[N];内蒙古日报(汉);2008年

10 徐恒泰;要全力抓好蒙古文教学资源建设[N];鄂尔多斯日报;2008年

相关博士学位论文 前9条

1 苏向东;基于深度学习和知识策略的蒙古文古籍识别研究[D];内蒙古大学;2016年

2 巴图额尔敦;文本资源检索技术在西里尔蒙古文远程教育系统中的应用研究[D];内蒙古大学;2017年

3 淑琴;蒙古文同形词知识库的构建[D];内蒙古大学;2010年

4 达古拉;《清内秘书院蒙古文档案汇编》语言研究[D];内蒙古大学;2012年

5 魏宏喜;蒙古文古籍图像检索技术研究[D];内蒙古大学;2012年

6 通拉嘎;基于蒙古文语料库的人名自动识别[D];中央民族大学;2013年

7 莎日娜;乌兰巴托版蒙古文译本《今古奇观》研究[D];中国社会科学院研究生院;2010年

8 王桂荣;蒙古文字结构研究[D];内蒙古大学;2011年

9 普日布苏荣;蒙古语语料库建设的有关问题[D];内蒙古大学;2015年

相关硕士学位论文 前10条

1 关高娃;蒙古文停用词和英文停用词比较研究[D];内蒙古大学;2011年

2 常红梅;衮布扎布语言论著中的蒙古文阿里嘎礼研究[D];内蒙古大学;2013年

3 刘璐;面向蒙古文增量g┱沟男畔⒓焖骷际跹芯縖D];内蒙古大学;2015年

4 李坤;蒙古文网络热点词提取算法研究[D];内蒙古大学;2015年

5 王洪伟;基于规则和统计的西里尔与传统蒙古文相互转换方法研究[D];内蒙古大学;2015年

6 张畔;蒙古文搜索引擎基本方法的实现[D];内蒙古大学;2015年

7 宋莉;蒙古文字造形元数据的分类编号探讨[D];内蒙古农业大学;2015年

8 青玉;指导小学生蒙古文正字法教学探析[D];内蒙古师范大学;2015年

9 达拉夫;文献学视角下的蒙古文古籍研究[D];内蒙古大学;2015年

10 王亚君;基于Linux IBUS的传统蒙古文输入法的研究与实现[D];内蒙古师范大学;2015年



本文编号:2453805

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2453805.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户df807***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com