基于DSpace构建传统蒙古文学科机构知识库平台
本文选题:机构知识库 + DSpace ; 参考:《计算机工程与科学》2010年10期
【摘要】:本文主要阐述了基于DSpace构建传统蒙古文学科机构知识库的难点以及解决的技术路线,包括蒙古文数字资料的采集、存储、检索以及显示等。针对蒙古文的构词和语法等方面的特点,对开源搜索引擎Lucene进行改进——采用B树管理Term、简化了特征词权值的计算、采用EC方法确定了蒙古文停用词表,实现了基于Lucene的蒙古文检索。
[Abstract]:This paper mainly expounds the difficulties of constructing the knowledge base of traditional Mongolian literature institutions based on DSpace and the technical route to solve, including the acquisition, storage, retrieval and display of Mongolian digital data. In view of the characteristics of Mongolian word-formation and grammar, this paper improves the open source search engine Lucene, which uses B-tree to manage term, simplifies the calculation of the weight of feature words, and uses EC method to determine the terminating vocabulary of Mongolian. Mongolian retrieval based on Lucene is realized.
【作者单位】: 内蒙古大学图书馆;
【基金】:国家自然科学基金资助项目(70863008) 内蒙古大学青年科学基金资助项目(ND0819)
【分类号】:TP391.1
【共引文献】
相关期刊论文 前10条
1 芮建武;吴健;孙玉芳;;国际化标准框架下蒙文操作系统的设计[J];计算机研究与发展;2006年04期
2 武宇飞;贾彦民;吴健;;基于OpenOffice.org蒙古文办公套件的设计与实现[J];计算机工程与应用;2006年17期
3 马玉芝;李俊;;基于UNICODE的多民族文字处理在移动终端上的实现[J];计算机应用;2006年01期
4 董治江,吴健,钟义信;基于OpenType的复杂文本语言处理的研究与实现[J];计算机应用研究;2004年10期
5 董治江,吴健,钟义信;在ICU中实现少数民族文字的处理[J];中文信息学报;2004年02期
6 姚延栋,吴健,孙玉芳,呼斯勒;传统蒙古文变形显示机制研究与实现[J];中文信息学报;2005年05期
7 刘汇丹;芮建武;姚延栋;吴健;;基于Qt的国际化图形用户界面设计与实现[J];中文信息学报;2006年04期
8 确精扎布;;关于传统语言学和蒙古文信息处理中几个问题的思考[J];内蒙古大学学报(人文.社会科学版);2006年01期
9 巩政,孟和吉雅,李平,敖其尔;图书馆蒙文信息管理系统的研究与设计[J];内蒙古大学学报(自然科学版);2001年06期
10 巩政,敖其尔,廷方;计算机在处理蒙文信息过程中的一些问题的探讨[J];内蒙古大学学报(自然科学版);2003年03期
相关会议论文 前1条
1 那日松;淑琴;;蒙古文信息熵和拉丁转写研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
相关硕士学位论文 前9条
1 杨文霞;基于Linux的民族文字显示处理[D];中国科学院研究生院(软件研究所);2004年
2 松云;基于蒙古文的英语辅助教学软件系统[D];内蒙古师范大学;2005年
3 那日松;英—蒙电子词典的构建和相关技术的研究[D];内蒙古大学;2005年
4 萨其容贵;蒙古语语音合成技术的研究[D];内蒙古大学;2005年
5 钱丽珠;蒙古文文献编目标准化问题研究[D];东北师范大学;2006年
6 包敏娜;《蒙古文印刷体扫描识别系统》(recog1.0版)自动校正算法研究[D];内蒙古大学;2007年
7 图格木勒;蒙古语语言资源库建设相关技术研究[D];内蒙古大学;2007年
8 苏道;蒙文文本分类技术研究与系统设计实现[D];内蒙古大学;2007年
9 陈羽m,
本文编号:1866927
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1866927.html