当前位置:主页 > 文艺论文 > 戏剧论文 >

莎士比亚戏剧英汉平行语料库的创建与应用,戏剧论文

发布时间:2016-07-07 19:07

  本文关键词:莎士比亚戏剧英汉平行语料库的创建与应用,,由笔耕文化传播整理发布。


您现在的位置:上海论文网 > 艺术论文 > 戏剧论文 > 莎士比亚戏剧英汉平行语料库的创建与应用

莎士比亚戏剧英汉平行语料库的创建与应用

发布时间:2013-09-09 点击次数:次

    1.引言莎士比亚研究一直是西方文学研究的“显学”之一,相关着作可谓“汗牛充栋”。自20世纪初以来,莎士比亚戏剧的多个汉译本相继问世,其中影响较大的有朱生豪(1947)、梁实秋(1947)和方平(2000)等翻译的汉译本。这些译本对我国现代戏剧和文学创作产生了深远的影响,而且很大程度上丰富了汉语的表现形式。然而,莎剧汉译研究的广度和深度仍然比较有限。现阶段莎士比亚戏剧汉译研究多局限于具体词汇或修辞手法的翻译研究,而关于句法和语篇层面的研究成果比较少见,且多为定性研究,定量研究鲜见。这与莎剧汉译本在中国文学乃至文化发展历程中的重要地位十分不相称。究其原因,主要是因为莎剧剧本多,内容博大精深,莎剧汉译研究费时费力。因此,建设莎士比亚戏剧英汉平行语料库,开展基于语料库的莎剧汉译研究十分重要。研究人员可以充分利用语料库储存数据大、计算机运行速度快、语料库工具能对大量数据进行准确分析的优势,系统、全面地对多个莎剧汉译本进行比较分析,通过数据分析和功能阐释相结合,获得客观可信的研究结果。
  为此,我们自2005年起便开始着手建设莎士比亚戏剧英汉平行语料库,经过数年努力,已基本建成,并开展了一系列前期研究。该语料库收入莎士比亚戏剧原着、这些戏剧的梁实秋译本和朱生豪译本和方平译本,以及汉语原创戏剧,计划库容为6百万字,目前在进一步扩容和深加工之中。建设平行语料库,尤其建设能够实现一个原着与三个译本句级对齐,且库容达6百多万字的语料库,不仅要耗去大量的人力和物力,而且技术层面亦具有较大难度。本文拟介绍莎士比亚戏剧英汉平行语料库的创建过程及其在莎士比亚戏剧汉译研究中的具体应用,以期为英汉平行语料库的建设及其在译学研究中的应用提供借鉴。
  2.莎士比亚戏剧英汉平行语料库的创建一般而言,英汉平行语料库的创建步骤主要为:1)中英文语料的选择与输入;2)语料的预处理;3)语料的标注和分词;4)语料的平行对齐;5)语料库出版;6)语料库网上检索。目前,莎士比亚戏剧英汉平行语料库已完成第1至第4个步骤。至于语料库的出版和网上检索,待完成所有语料的输入和深加工,并解决相关版权问题之后方可进行。
  2.1中英文语料的选择与输入自莎士比亚戏剧全集问世以来,英文版本为数众多,受到人们推崇的版本主要有牛津版(1743)、撒缪尔·约翰逊版(1765)、里德版(1803)、河畔版(1974)以及阿登系列版本(1899/1958/1995)等等。经过讨论,我们选择莎士比亚戏剧全集的牛津版作为语料库的英文语料。牛津版是公认校勘准确的版本,本语料库拟选择梁实秋、朱生豪和方平翻译的三种莎士比亚戏剧全集作为中文语料,其中梁实秋译本和朱生豪译本都译自牛津版。此外,牛津版莎士比亚戏剧全集的电子版可以从互联网上免费下载,能省去英文语料输入的大量工作。
  就莎士比亚戏剧全集的汉译本而言,比较知名的主要有曹未风译本、朱生豪译本、梁实秋译本和方平译本。曹未风译本由贵阳文通书局于1942年至1944年之间出版,收入曹未风译的莎剧剧本11部。朱生豪译本最早由世界书局出版(1947),后来分别由作家出版社(1954)、人民文学出版社(1978)、时代文艺出版社(1996)和译林出版社(1998)等出版。该译本共收入莎剧37部,其中31部为朱生豪所译。梁实秋译本由台湾远东图书公司出版(1967),收入梁实秋翻译的全部36部莎剧剧本。1995年,内蒙古文化出版社和中国广播电视出版社分别出版梁实秋翻译的《莎士比亚全集》。方平译本,即《新莎士比亚全集》(河北教育出版社,2000),由方平和梁宗岱参照欧美当代备受重视的Bevington全集本(1992年)与Riverside(河畔)全集本(1974年),以诗体方式译出。我们根据译本的影响及所收莎剧剧本是否齐全,最终确定了朱生豪译本、梁实秋译本和方平译本为语料库的中文语料。不过,朱生豪译本中有6部并非朱生豪所译,故不作为中文语料。
  确定语料库的中英文文本之后,我们便开始进行中英文语料的输入。牛津版莎士比亚戏剧全集和朱生豪译本可从网上下载,并直接转化成TXT格式。梁实秋译本也可从网上下载,但其格式为PDF格式,需应用清华紫光OCR软件转换成TXT格式。方平译本目前还不能从网上下载,需要使用高速扫描仪扫描或人工输入。为保证语料库的语料质量以及研究的可靠性,我们组织人力仔细校对输入好的语料,检查语料是否出现倒码、拼写错误以及具体内容与蓝本出入等问题,并及时更正。
  2.2语料的预处理语料的预处理主要包括文本格式的统一、各种杂质的清除和中英文语料的分存等。作为中文语料的三个汉译本分别由不同出版社出版,文本格式如字体、段落编排和文档格式等各不相同,我们故而首先统一三个汉译文本的格式。另外,直接从网上下载的语料,往往有多余的空格及空行、断行、多余的语言符号,以及一些不必要的图形或符号等。这些杂质对于研究而言没有什么实质意义,需要清除。另外,上述莎剧汉译本均附有数量不等的注释,与研究内容没有多大关联,我们均将其删除。在输入并校对语料、清除杂质、统一语料格式之后,我们将每部莎士比亚戏剧的中英文语料分存。
  2.3语料的分词和标注莎士比亚戏剧英汉平行语料库需应用ParaConc和Wordsmith等软件对中英文语料进行平行处理和检索,但是由于汉语文字之间没有空格,国外研发的许多软件不能识别汉字。为保证汉语语料与国外软件之间的兼容性,我们选用汉语词法分析软件ICTCLAS3.0版对汉语语料进行分词处理。该软件由中国科学院计算机技术研究所开发,功能主要为词汇切分和词性标注。
  我们讨论了汉语语料分词的具体方法(邹颂兵2009a:158)。首先,选择ICTCLAS3.0版中的“操作选项”栏目下的“词语切分”和“输出格式”栏目下的“北大标准”,“973标准”或XML格式。考虑到“北大标准”与该软件的兼容性很强,我们将“输出格式”确定为“北大标准”。然后,选中“处理文件”,上载需进行词语切分处理的中文语料,并单击“运行”,便可完成汉语语料的分词处理。
  语料的标注是指对语料库的具体语料样本属性或语言学特征进行描述,分为篇头信息和篇体信息标注。后者包括段落标注、语句标注、词性标注、语法标注和语义标注等。莎士比亚戏剧英汉平行语料库语料标注主要由词性标注和段落标注等篇体信息标注组成。我们分别选用ICTCLAS3.0和CLAWS等软件对中英文语料进行词性标注处理,而段落标注则使用EmEditor软件。

上一篇:戏剧在教育中的地位与作用

下一篇:高等戏剧教育的两种模式及其前景

相关内容


  本文关键词:莎士比亚戏剧英汉平行语料库的创建与应用,由笔耕文化传播整理发布。



本文编号:66719

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/xijuwudaolunwen/66719.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5d4d5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com