面向维汉机器翻译的语料筛选技术研究
发布时间:2017-12-26 00:12
本文关键词:面向维汉机器翻译的语料筛选技术研究 出处:《计算机应用研究》2016年12期 论文类型:期刊论文
【摘要】:统计机器翻译是目前主流的机器翻译技术,其在维汉翻译中良好的性能已经得到了广泛的认可。维汉统计机器翻译的最终结果同样是受这几方面的影响:翻译模型、语言模型、语料质量和规模等。旨在通过对维汉双语训练语料的筛选来提高最终的机器翻译性能。在相关学者的研究基础上,提出了改进的IBM1模型评价句对齐质量、双语语言模型困惑度进行语料筛选和多种筛选指标综合求交集的方法。这些方法没有语言特性的依赖,支持维汉双语语料的筛选。通过实验可证明,使用笔者提出的方法可以得到更优的维汉机器翻译结果。
【作者单位】: 中国科学院新疆理化技术研究所;新疆民族语音语言信息处理重点实验室;中国科学院大学;乌鲁木齐市公安局电子数据鉴定实验中心;中国科学院声学研究所;
【基金】:中国科学院西部之光项目(XBBS201216,LHXZ201301);中国科学院先导科技专项项目(XDA06030400) 新疆维吾尔自治区青年自然科学基金资助项目(2015211B034) 新疆维吾尔自治区重点实验室开放课题项目(2015KL031)
【分类号】:TP391.2
【正文快照】: 0引言维吾尔语是维吾尔族的母语,在我国的使用人数已经超过了一千万。随着国家一带一路政策的深入,维吾尔语和汉语之间的机器翻译近年来也逐渐成为了一个热点问题。在众多研究者们的共同努力下,维汉统计机器翻译的准确率一直在不断攀升。值得注意的是,作为目前主流的机器翻译,
本文编号:1335023
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1335023.html