文本资源检索技术在西里尔蒙古文远程教育系统中的应用研究
本文关键词:文本资源检索技术在西里尔蒙古文远程教育系统中的应用研究 出处:《内蒙古大学》2017年博士论文 论文类型:学位论文
更多相关文章: 蒙古国远程教育系统 动态教育系统 西里尔蒙古文文本 E—测试结果
【摘要】:对于地广人稀的蒙古国来说,教育普及是个很重要的问题,而基于网络的远程教育系统是解决蒙古国高等教育普及的最佳选择。虽然蒙古国有远程教育系统,但是大部分都是静态的,需要建立动态远程教育系统以提高学习的效率。本文建立了基于E-测试的动态远程教育系统,可实现自动检测学生的知识水平,从教材文本库中自动提取适合学生学习的内容。因为蒙古国的教材文本库使用西里尔蒙古文,所以需要研究面向西里尔蒙古文的信息检索技术。蒙古国"信息技术、邮递、联络局"发布的2016年工作计划中提到了要促进蒙古国检索系统的发展。但是西里尔蒙古文检索系统方面的研究工作很少,只有 B·Khaltar、O·Chimeddorj 和 AtsushiFujii 等人从事相关研究。B·Khaltar 主要研究词干提取算法及其在信息检索中的应用,O·Chimeddorj主要是进一步完善了 B·Khaltar的算法,并将其使用于西里尔蒙古文与英文统计机器翻译中。本文在充分调研其他语言信息检索现状的基础上,深入研究了动态远程教育系统中西里尔蒙古文信息检索方面的问题。研究工作的创新点如下:1.在西里尔蒙古文远程教育系统中,为了提高文本检索的召回率,本文从西里尔蒙古文的构词和构形特点出发,提出了基于规则的词干提取方法。整理构建了词干资源库,其中包括西里尔蒙古文词干库(包含41000词条)、词缀库(包含168词条)和语法库(包含935词条)。通过切词缀的方式获取词干。本文在560件法律文件文本(包含1.780.968字)及75件(包含178.448字)大学教材文本数据集上进行了实验,结果表明词干提取的准确率能够达到92.6%,从而证明所提方法的有效性。2.在西里尔蒙古文远程教育系统中,为了提高文本检索效率,本文提出了确定西里尔蒙古文索引项的方法。该方法分别统计西里尔蒙古文提取词干、TF-IDF以及词共现信息,通过对比实验确定了提取词干的效果最好。并在1450件法律文件文本及250件大学教材文本数据集上进行了实验,结果表明提取关键词的准确率分别为词共现信息78%、TF-IDF59%、提取词干88%,召回率分别为词共现信息85%、TF-IDF67%、提取词干87%,从而证明所提方法的有效性。3.为了验证本文所提出的基于词干和关键词的教学文本资源检索系统的性能,采用向量空间模型(Vector Space Model,VSM)进行实验。在250件大学教材文本数据集上做了实验,两种所提方法的Cosine平均分别达到77%和85%,为了证实上述实验结果,在2560件大学教材文本数据集上做了实验,MAP 分别达到 75%(k=100),79%(k=40)和 100%(k=1)。从而证明本文所提出的基于词干和关键词的检索方法是有效的、合理的。
【学位授予单位】:内蒙古大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP391.3
【相似文献】
中国期刊全文数据库 前10条
1 红梅,敖其尔,白云莉;托忒蒙古文读音输入法的设计与实现[J];内蒙古师范大学学报(自然科学汉文版);2004年02期
2 乌日娜;;清代蒙古文历史文献及其整理研究概况[J];兰台世界;2011年19期
3 嘎日迪,赵小兵,马红旭,赛音,白小玲;蒙古文自动处理系统研究[J];中文信息学报;1999年04期
4 菊花;金良;;使用程序自动分析蒙古文词的研究[J];内蒙古师范大学学报(自然科学汉文版);2014年02期
5 乌林西拉;内蒙古自治区图书馆学(蒙古文)的研究与发展[J];国家图书馆学刊;2000年01期
6 S·苏雅拉图;蒙古文整词计算机生成理论研究[J];中文信息学报;2001年04期
7 朝克图;关于蒙古文报刊史研究中的几个问题[J];蒙古学信息;2001年04期
8 红梅;基于Windows 2000/XP平台蒙古文输入法的设计技术[J];内蒙古师范大学学报(自然科学汉文版);2005年01期
9 巩政;郝莉;杨旭华;;非标准蒙古文字符编码转换为国际编码的一种方法[J];内蒙古大学学报(自然科学版);2008年02期
10 巩政;关高娃;;蒙古文停用词和英文停用词比较研究[J];中文信息学报;2011年04期
中国重要会议论文全文数据库 前10条
1 包艳花;图格木勒;;多字体印刷蒙古文识别后处理研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 吉仁尼格;;蒙古文同形词的统计法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
3 呼斯勒;六月;斯日古楞;;浅谈蒙古文通用编辑器几点基本规范[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
4 道布;;回鹘式蒙古文[A];中国民族古文字[C];1982年
5 道布;;回鹘式蒙古文研究概况[A];中国民族古文字研究[C];1980年
6 白双成;胡其图;木仁;;蒙古文音节切分算法实现及其应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 孟和吉雅;白音门德;敖其尔;田会利;;蒙古文语音合成技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 孟和吉雅;敖其尔;巩政;;蒙古文网页制作技术分析[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
9 确精扎布;;蒙古文编码国际标准通过以后研制的几种蒙古文录入系统比较[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
10 宝金良;;蒙古文文本标点符号及其属性字段设置[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 吉儒木图;手机可以使用蒙古文了[N];内蒙古日报(汉);2007年
2 记者 解太荣;《蒙古秘史》回鹘体蒙古文复原项目完成[N];锡林郭勒日报;2009年
3 孟克;如何打破蒙古文图书产销两难的困境[N];中国民族报;2010年
4 记者 阿斯钢;蒙古国总统签命令推广回鹘式蒙古文[N];新华每日电讯;2010年
5 记者 苏布达;全盟首届蒙古文图书节落幕[N];锡林郭勒日报(汉);2012年
6 陈岗龙 (蒙古族);蒙古文文学翻译的两个问题[N];文艺报;2013年
7 金坛;蒙古文:描绘大自然的千姿百态[N];中国民族报;2014年
8 阿勒得尔图;沙日布却玛:用回鹘体蒙古文还原《蒙古秘史》[N];中国民族报;2006年
9 记者 张文强;蒙古文图书农牧民阅读大接力活动启动[N];内蒙古日报(汉);2008年
10 徐恒泰;要全力抓好蒙古文教学资源建设[N];鄂尔多斯日报;2008年
中国博士学位论文全文数据库 前9条
1 苏向东;基于深度学习和知识策略的蒙古文古籍识别研究[D];内蒙古大学;2016年
2 巴图额尔敦;文本资源检索技术在西里尔蒙古文远程教育系统中的应用研究[D];内蒙古大学;2017年
3 淑琴;蒙古文同形词知识库的构建[D];内蒙古大学;2010年
4 达古拉;《清内秘书院蒙古文档案汇编》语言研究[D];内蒙古大学;2012年
5 魏宏喜;蒙古文古籍图像检索技术研究[D];内蒙古大学;2012年
6 通拉嘎;基于蒙古文语料库的人名自动识别[D];中央民族大学;2013年
7 莎日娜;乌兰巴托版蒙古文译本《今古奇观》研究[D];中国社会科学院研究生院;2010年
8 王桂荣;蒙古文字结构研究[D];内蒙古大学;2011年
9 普日布苏荣;蒙古语语料库建设的有关问题[D];内蒙古大学;2015年
中国硕士学位论文全文数据库 前10条
1 关高娃;蒙古文停用词和英文停用词比较研究[D];内蒙古大学;2011年
2 常红梅;衮布扎布语言论著中的蒙古文阿里嘎礼研究[D];内蒙古大学;2013年
3 刘璐;面向蒙古文增量g┱沟男畔⒓焖骷际跹芯縖D];内蒙古大学;2015年
4 李坤;蒙古文网络热点词提取算法研究[D];内蒙古大学;2015年
5 王洪伟;基于规则和统计的西里尔与传统蒙古文相互转换方法研究[D];内蒙古大学;2015年
6 张畔;蒙古文搜索引擎基本方法的实现[D];内蒙古大学;2015年
7 宋莉;蒙古文字造形元数据的分类编号探讨[D];内蒙古农业大学;2015年
8 青玉;指导小学生蒙古文正字法教学探析[D];内蒙古师范大学;2015年
9 达拉夫;文献学视角下的蒙古文古籍研究[D];内蒙古大学;2015年
10 王亚君;基于Linux IBUS的传统蒙古文输入法的研究与实现[D];内蒙古师范大学;2015年
,本文编号:1317077
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1317077.html