基于Unicode编码的现代藏文排序系统的设计
[Abstract]:The ranking problem of Tibetan language is one of the important support for Tibetan language towards information. A great deal of cataloguing and searching, including the sorting of people's names, require the Tibetan language to be arranged in an orderly manner to improve its efficiency. Tibetan sorting is also a variety of dictionaries, reference books in the preparation of the first issue to be solved. The arrangement of Tibetan language is solved, which can lay the foundation for the subsequent processing of Tibetan language information. Due to the unique two-dimensional structure of Tibetan language, the sorting of Tibetan characters is more complicated than that of other characters. According to the dictionaries of modern Tibetan and the structure of modern Tibetan, In this paper, a linear string is put forward for example, "add consonant vowel before basic consonant, add consonant vowel before consonant and add consonant after consonant". The vacant part is replaced by spaces with small Unicode code value. Finally, the same result is obtained by comparing the sorting codes with the dictionary order. The whole modern Tibetan sorting system consists of input module, syllable segmentation module, syllable decision module, sorting code extraction and compression module, sort code comparison module, and result display module. In the syllable determination module, according to the characteristics of modern Tibetan and Unicode Tibetan coding, a unique syllable decision algorithm is designed. After the syllable is determined, the corresponding sorting codes are extracted from the DUCET. Since the extracted sorting code has a lot of duplicates and zero parts, the sorting code must be compressed. Compressed sorting codes can be sorted by sorting algorithms. The sorting system designed according to the above modules can sort the modern Tibetan language correctly.
【学位授予单位】:青海师范大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.1;H087
【相似文献】
相关期刊论文 前10条
1 吴兵;江荻;;藏文国际编码的发展与技术应用[J];西南民族大学学报(人文社会科学版);2011年08期
2 张建木;读《唐蕃会盟碑》札记二则[J];中央民族大学学报(哲学社会科学版);1981年01期
3 张济川;;藏文元音a的表示法[J];民族语文;1982年01期
4 张连生;;藏文号码代字及其计算机排索[J];语言研究;1983年02期
5 才旦夏茸 ,张凤翮;关于藏族历代翻译家梵译藏若干问题之研究[J];西北民族大学学报(哲学社会科学版);1985年03期
6 毛继祖;解放前青海省藏文木刻本科技图书印行概况[J];青海民族学院学报;1989年03期
7 郭登元;汉诗(词)藏译浅谈之一[J];青海民族学院学报;1990年02期
8 郑张;尚芳;;上古汉语的S-头[J];温州师范学院学报;1990年04期
9 强俄巴·次央;;试析敦煌藏文P.T.999号写卷[J];西藏研究;1990年01期
10 于洪志;藏文信息处理有重大突破——制定点阵字型尽快实现网上通讯[J];中文信息;1997年06期
相关会议论文 前10条
1 康才uo;江荻;;基于Unicode编码的藏文转写拉丁文本的算法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 张轴材;;ISO/IEC 10646/Unicode的新进展及其实现[A];中文信息处理技术研讨会论文集[C];2004年
3 刘汇丹;诺明花;赵维纳;吴健;贺也平;;藏文编码转换软件“藏码通”的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 金志海;;Java编程技术中汉字问题的分析及解决[A];海南省通信学会论文集(二○○一年)[C];2001年
5 阿布力米提·阿不都热依木;吐尔根·依布拉音;;基于Unicode的维吾尔文信息处理平台的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 岳耀明;;Windows平台下朝鲜文输入法实现详析[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
7 地力木拉提.吐尔逊;瓦依提.阿不力孜;吐尔根.伊布拉音;;古维吾尔文(察合台文)文献数字化整理系统中多文种混合处理的实现[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 周永;陈宁;;几种典型汉字编码之间转换的原理与实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
9 马良成;运中旺苏;张步明;;北宋“崇宁重宝背藏文钱”初探[A];甘肃省钱币学会第四次会员代表大会专辑[C];2001年
10 运中旺苏;张步明;;北宋“崇宁重宝背藏文钱”再探[A];第二届西北五省区钱币学会协作会议专辑[C];2002年
相关重要报纸文章 前10条
1 李汉强;不要小看IIS的恶性杀手Unicode[N];中国电脑教育报;2004年
2 飘零雪;当心Unicode漏洞造成IIS“变节”[N];电脑报;2002年
3 本报记者 王向华;藏文图书“走进”藏区农家书屋[N];四川日报;2009年
4 本报记者 康 丽 茅卫东;阿牛和他的普利藏文学校[N];中国教师报;2005年
5 记者 王杰;藏文软件推广应用项目启动仪式在拉萨举行[N];西藏日报;2009年
6 记者 涂洪长;手机藏文资讯研发启动[N];人民日报海外版;2009年
7 德吉 边巴次仁;藏文走在我国少数民族文字信息化前列[N];中国民族报;2008年
8 涂洪长;手机藏文资讯研发启动 藏文将畅游无线通信网络[N];中国民族报;2009年
9 记者 张黎黎 晓勇;让藏文驰骋在信息高速路上[N];西藏日报;2010年
10 记者 朗杰 裘立华;藏文词典越来越厚[N];新华每日电讯;2002年
相关博士学位论文 前10条
1 芮建武;操作系统国际化基础的研究与实践[D];中国科学院研究生院(软件研究所);2005年
2 王迈;语言形式化原理[D];上海外国语大学;2011年
3 那加才旦;古代藏语文研究(7-11 A.D.)[D];中央民族大学;2012年
4 段玉泉;语言背后的文化流传:一组西夏藏传佛教文献解读[D];兰州大学;2009年
5 斯塔;本体、方法、境界[D];中央民族大学;2007年
6 东主才让;藏族宗教与文字的产生和发展研究[D];中央民族大学;2013年
7 张云;元代吐蕃地方行政体制研究[D];南京大学;1993年
8 乌云毕力格;论《苏布喜地》及其对蒙古箴言诗的影响[D];内蒙古大学;2009年
9 王献军;西藏政教合一制研究[D];南京大学;1997年
10 王璞;藏族史学思想论纲[D];云南大学;2002年
相关硕士学位论文 前10条
1 李继文;基于Unicode编码的现代藏文排序系统的设计[D];青海师范大学;2013年
2 苗军;Unicode/XML在电子出版物中的实现[D];河北工业大学;2002年
3 朱峰;软件国际化与本地化自动化转换模型和方法[D];浙江大学;2012年
4 陈羽m,
本文编号:2395084
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/2395084.html