维吾尔语-乌兹别克语机器翻译研究

发布时间:2018-05-07 09:20

  本文选题:机器翻译 + 乌兹别克语 ; 参考:《新疆大学》2017年硕士论文


【摘要】:自从计算机发明以来,人们对机器翻译的兴趣越来越大。机器翻译是指计算机把一种自然语言(源语言)转换成另一种自然语言(目标语言)的过程。维吾尔语和乌兹别克语在单词结构、构形、词性、句法等方面有很多相同点或相似之处。因此,实现维吾尔语和乌兹别克语的机器翻译比较容易。本文中提出了基于词典和规则相结合的维吾尔语和乌兹别克语机器翻译方法。首先分别研究维吾尔语和乌兹别克语的字母及其对应关系、音节划分规则和音节关系、单词结构和词类关系、句子结构和成分关系等。在此基础上,构建两种语言对齐词典和字母对应规则库并实现基于词典的维吾尔语和乌兹别克语翻译方法和基于字母转换规则的维吾尔语和乌兹别克语翻译方法;随后结合两种翻译方法实现基于词典和规则相结合的维吾尔语和乌兹别克语机器翻译系统。乌兹别克语到维吾尔语方向的翻译中发现,乌兹别克语字母和维吾尔语字母之间存在歧义现象,一个乌兹别克语字母对应两个及以上维吾尔语字母。对这种歧义现象用最大熵特征选择方法来判断歧义字母对应的维吾尔语字母并生成目标语言。初步优化了基于词典和规则相结合的乌兹别克语-维吾尔语机器翻译系统。小规模的实验结果表明该系统在维吾尔语和乌兹别克语机器翻译准确率较高,其中乌兹别克语到维吾尔语方向的翻译质量比维吾尔语到乌兹别克语方向的翻译质量高。在以后的工作中,该系统还可通过双语词干库和词缀库规模的不断扩大、双语翻译规则的不断完善,以及可以用现有的词典和规则相结合的翻译基础上分析词性变化等方法有效提高翻译质量。
[Abstract]:Since the invention of computer, people have become more and more interested in machine translation. Machine translation is the process by which a computer converts one natural language (source language) into another (target language). Uygur and Uzbek have many similarities or similarities in word structure, configuration, part of speech, syntax and so on. Therefore, the implementation of Uighur and Uzbek machine translation is easier. In this paper, a method of Uygur and Uzbek machine translation based on dictionary and rule is proposed. This paper first studies the letters and their corresponding relations between Uyghur and Uzbek, the syllable division rule and syllable relation, the word structure and part of speech relationship, the sentence structure and the component relation and so on. On the basis of this, we construct the dictionary and alphabetic correspondence rule library and realize the translation methods of Uygur and Uzbek languages based on dictionaries and the translation methods of Uyghur and Uzbek languages based on alphabetic conversion rules. Then the Uygur and Uzbek machine translation systems based on dictionaries and rules are implemented in combination with two translation methods. In the translation from Uzbek to Uygur, there is ambiguity between the Uzbek and Uygur letters, and one Uzbek letter corresponds to two or more Uygur letters. The maximum entropy feature selection method is used to determine the Uygur letters corresponding to the ambiguous letters and to generate the target language. The Uzbek-Uygur machine translation system based on dictionaries and rules is preliminarily optimized. The results of small-scale experiments show that the accuracy of the system in Uygur and Uzbek machine translation is higher, and the translation quality from Uzbek to Uygur is higher than that from Uygur to Uzbek. In the future work, the system can also expand the scale of bilingual stem database and affix database, and improve the rules of bilingual translation. The translation quality can be improved by analyzing the change of part of speech on the basis of the combination of existing dictionaries and rules.
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.2

【参考文献】

相关期刊论文 前10条

1 郑明秋;;基于C#语言的面向对象编程特征研究与实现[J];通讯世界;2015年21期

2 李景贤;;乌兹别克斯坦:古丝绸之路直穿而过的国度[J];时事报告;2015年09期

3 王鑫;;大数据时代下新的翻译机器[J];现代交际;2014年10期

4 云耘;桂亮;;从社会历史进程角度看乌兹别克语拉丁化[J];语文学刊(外语教育教学);2014年06期

5 麦迪乃·热合木江;艾尼宛儿·托乎提;吾守尔·斯拉木;阿依佳肯·阿曼太;;多语种(汉、维、哈、柯文)辅助办案系统的开发[J];计算机应用与软件;2013年08期

6 艾尼瓦尔·艾合买提江;;初谈维吾尔语与乌兹别克语元音区别[J];科技信息;2013年11期

7 袁小于;;基于规则的机器翻译技术综述[J];重庆文理学院学报(自然科学版);2011年03期

8 阿布都外力·克热木;;突厥语族民族文化专题研究点评[J];西北民族大学学报(哲学社会科学版);2011年02期

9 秦洪武;;英译汉翻译语言的结构容量:基于多译本语料库的研究[J];外国语(上海外国语大学学报);2010年04期

10 艾山·吾买尔;吐尔根·依步拉音;;基于最大熵的维吾尔语句子边界识别模型[J];计算机工程;2010年06期

相关会议论文 前1条

1 谭咏梅;王枞;王小捷;钟义信;;基于实例的机器辅助写作翻译系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

相关博士学位论文 前1条

1 阿达来提;中国乌孜别克族语言使用现状研究[D];中央民族大学;2013年

相关硕士学位论文 前7条

1 阿卜杜吾普尔·热合曼;论翻译批评及其汉维翻译中的运用研究[D];新疆大学;2015年

2 翟云超;机器翻译的问题及对策研究[D];华北理工大学;2015年

3 唐建;基于规则的汉英机器翻译研究与实现[D];成都理工大学;2013年

4 卡哈尔江·阿比的热西提;基于实例的汉维—维汉双向机器翻译系统的研究[D];上海交通大学;2012年

5 吉莉;乌兹别克斯坦汉语教学状况与分析[D];陕西师范大学;2013年

6 魏巍;中英概念隐喻基于经济报道语料的对比分析[D];海南大学;2010年

7 陈鹏;基于语料库的维吾尔语词干提取和词性标注[D];新疆大学;2006年



本文编号:1856359

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1856359.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户626f6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com