基于双语平行语料库的“V+到NP+”汉韩翻译对比研究
构建一个双语平行语料库的主要任务是双语语料的加工和其对语料库的组织。为了更好地进行这两项工作,首先需要保证语料库的质量和规模,之后再推进语料库的构建。关于平行语料库(parallelcorpus)的定义,主要有3种观点。第一种观点认为平巧语料库由取样标准相同的单语语料库构成,即将"parallel"理解为语料取样标准的一致性。第二种观点认为平行语料库由原文文本以及与之对应的译文文本构成,即将"parallel"理解为一种翻译对应关系。而第三种观点比较折中,认为以上两种语料库均属于平行语料库范畴。自然语言处理是利用计算机理解、生成、分析人类语言的一种人工智能技术。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。自然语言处理并不是一般地研究自然语言,而是研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。实现人机之间自然语言通信意味着要让计算机既能理解自然语言文本的含义,也能以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。
......
第二章人民日报《中央日报"V+到+NP"对比分析
第一节《人民》的"V+到+NP"结构分折
由〈表3>可知,在《人民日报》的"V+到+NP"结构所使用的单音节动词中,出现次数最多的动词是"看、来、找",这3个动词的出现次数都在100次以上。具体而言,动词"看"的出现次数最多,使用"看"的句子共有312个,动词"看"占单音节动词总数的21.3%。出现次数居第二位的动词是"来",使用"来"的句子共有192个,动词"来"占单音节动词总数的13.1%。动词"找"的出现次数排在第三,使用"找"的句子共有105个,动词"找"占单音节动词总数的7.2%。
第二节《中央》(汉锋)的"V+到+NP"结构分析
《中央日报》中使用"V+到+NP"结构的句子共有3380个,这些句子中所使用的动词共有445个。首先,由单音节动词构成的句子共有20巧个,频度为59.6%,所使用的单音节动词共有122个,频度为27.4%。其次,由双音节动词构成的句子共有13化次,占"V+到+NP"结构的句子总数的40.4%,所使用的双音节动词共有323个,占整体动词的72.6%。依据上述统计结果可知,和《人民日报》情况相同,《中央日报》中使用单音节动词的"V+到+NP"结构的句子占句子总数的一半以上,但是双音节动词在整体动词中所占的比率是单音节动词所占比率的2倍以上。《中央日报》中出现的"V+到+NP"结构所使用的全体动词的统计结果显示在〈附录3>、〈附录4>中,将在句子总数中所占比例为0.03%的动词排除在外。第三章、"V+到+NP"结构的用例统计.........21
第一节"V+到+NP(一般)"结构分类..................14第二节"V+到+NP(处所)"结构分类..........25
第三节"V+到+NP(时间)"结构的分类..........30
第四节"V+到+NP(数量)"结构的分类..........33
第四章、"V+到+NP"韩译助词与形态功能分析..........67
第五章中韩机器翻译"V+到+NP"对比分析..........87
第一节机器翻译偏误类型..........87
第二节"V+到+NP"四种类型的人机翻译对比分析..........95
第五章中韩机器翻译"V+到+NP"对比分析
第一节机器翻锋偏误类型
与统计方式相比,基于实例的机器翻译方法是通过双语语料库在翻译的过程中还要查询并利用语解库。在基于实例的机器翻译中,实例是从真实存在的翻译语料库中抽取而来的。其基本思想由日本著名的机器翻译专家长尾真提出,其分析外语初学者的基本模式,发现初学外语的人总是先记住最基本的英语句子和对应的日语句子,而后做替换练习。其翻译过程是首先将源语言正确分解为句子,然后分解为短语碎片,使用类比的方法把这些短语碎片译成目标语言短语,最后把该些短语合并成长句的结构。但是,因为受限于语料库规模,这种方法很难达到较高的匹配率。所以只有限定在比较窄的或者专业的领域时,翻译效果才能达到使用者的要求。因而到目前为止,还很少有机器翻译系统采用纯粹的基于实例的方法。第二节"V+到+NP"四种类型的人机葡译对比分析
本论文以平行语料库的"V+到+NP"结构的四种类型为重点,对人机翻译进行对比研究。下面将首先限定本论文的研究范围。(一)研究对象不包括没有得到机器翻译译文的句子。这是因为若分析此类句子,则在对比人机翻译时,不能掌捏正确的统计、对比、分析结果。(二)研究对象不包括机器翻译中的严重病句。由于机器翻译本身的局限性,在翻译过程中,经常会出现严重病句。对于此类不能判别源语言和目标语言之间关系的病句,本论文将其排除在研究范围之外。(三)在由2-3个句子组成的复杂长句中,仅截取包含"V+到+NP"结构的部分进行分析。本论文所使用的语料库中存在很多以逗号连接而成的复合句。此类情况和(一)(二)的情况相似,无法对人工翻译和机器翻译的所有句子进行对比。因而本论文只选取包含"V+到+NP"结构的部分进行研究。本论文搜集了《人民日报》和《中央日报》两年期间的中文语料和韩文语料,构建了语料库,以语料库为基础捜罗包含"V+到+NP"结构的所有句子,构建了双语平行语料库。........
本论文的研究目的在于通过双语平行语料,全面研究、阐明和"V+到+NP"结构互相对应的所有韩语语法形态。迄今为止,有关"V+到+NP"结构的研究主要是针对"到"的词性的研究和针对"V+到+NP"结构的类型及语法意义的研究。然而和前述的既有研究相比,有关"V+到+NP"结构汉韩翻译的硏究非常之少,尤其很难找到有关"V+到+NP"结构和韩文句子对应情况的研究。本论文将基于双语平行语料库,以分析"V+到+NP"结构的汉韩翻译惰况,阐明"V+到+NP"结构和韩文的对应形式为研究目的。
........
参考文献(略)
,
本文编号:98593
本文链接:https://www.wllwen.com/wenshubaike/lwfw/98593.html