基于信息技术常用短语表的编撰和启示
一、研究背景
1.语块在外语教学中的重要性近年来,语言学界越来越认识到语块在语言习得(尤其是二语习得)以及语言研究中的重要性。Skehan(1998)指出,二语习得是沿着两条路进行的:规则学习(rule—based learning)和范例学习(exemplar-based learning)。在前一种学习途径中,语法被认为是生成语言的基本框架,而词汇只是填充框架的选择,语言产生过程就是用词汇来填充语法框架的空位;后一种学习模式则认为,语言是语块的构建,语言的产出就是使用语块来组装语句。Nattinger&DeCarrigo(1992)在这之前已经发现大量的语篇是由语块构建起来而不是语法生成的。Erman&Warren(2000)的进一步研究表明,占56.8%的口语语篇和52.3%的书面语语篇是由语块构建的。因此,与其说单词组建了语言,还不如说语块是构建交际语篇的基本单位。无论对于操母语者还是二语习得者,掌握语块的重要意义在于减少语言加工的时间,提高语言加工的效率。如果学习者的大脑中储存了大量语块,在语言使用中就能轻易地检索和调用这些语块,减少信息加工和编码的任务,从而提高语言产出的流利性。正如Skehan(1996)所言,语块使用是一种重要的语言产出策略。综上所述,语块是外语学习的重点和难点,外语学习的重要任务就是掌握一定量的语块,在语言交际中实现灵活自如地提取和产出语块,从而提高语言的准确性和流利性。
2.编撰常用短语表是外语教学的必然需求既然掌握语块是外语学习过程中的重要目标,就有必要把语块教学列入外语课程大纲。
许多外语教学者(例如Sinclair,1988;Willis,l990;Lewis,1993)都把语块教学作为外语教学的重要任务,其中,最具有代表性的是Michael Lewis Lewis(1993)的词汇中心教学法(Lexical Approach)强调在教学中输入大量真实的语言,以便在上下文中学习和掌握语块,而不是学习孤立的单词。可是,真实的语言太多,要掌握的语块不计其数,哪些语块可以获得教学的优先权呢?Willis和Lewis等都主张用语料库的频率技术来筛选语块。频率是决定词汇学习重要性的一个标准。Leech(2011:4)指出: “频率越高,学习的重要性越大(more frequent=moreimportant to learn)”。长期以来,频率是单词筛选的重要标准,比如英国国家语料库(BNC)以1 000词为单位,按照频率把单词划分为若干个等级;West(1953)和Coxhead(2000)也在频率筛选的基础上,根据不同的学习目的编撰出普通词汇表(General Service List)和学术词汇表(Academic Word List)。但是,语块的筛选比孤立单词要复杂得多,语块的筛选涉及到语块词数、语块定义、语块分割和语块教学价值等诸多方面,仅靠频率远远不能满足教学需求。如果仅仅按照频率编撰出大量如out of the等非语块属性的共现词串则失去了其教学意义。近年来,国内很多学者也把语块理论应用于外语教学,例如王立非、张大风(2006)根据国外二语语块的研究现状指出,语块是中介语发展的重要途径,需要在外语课堂教学中引起重视。骆雁雁(2009)提出基于语块理论的大学英语词汇教学模式,即将原来的词汇表按照语块教学的要求进行改造,在教学实践中训练学生语块学习策略。肖武云(2011)要求学生在英语阅读以后,识别和运用课文中的语块,根据语块设计写作话题练习写作。但是以上的语块教学模式都没有表明所教授语块的选择标准,其语块的挑选方式具有较强的主观性和随意性。因此,至今为止,国内外语教学研究者还没有一个科学的语块挑选标准以满足一定水平学习者的需要。要改变这种现状,我们需要若干基于语料库等信息技术编撰的常用短语表,为外语教材编写、词汇教学和语块能力测试提供参考。
二、常用短语表编撰的相关研究
1.常用短语表编撰概况尽管很多应用语言学家(例如Wray &Namba,2003;Shin& Nation,2008; Simpson—Vlach & Ellis, 2010;M artinez & Schmitt,2012)都编撰过常用短语表,但目前涵盖面较广、编撰技术较成熟的常用短语表有两种,分别是Simpson—Vlach& Ellis(2010)编撰的学术性语块表Academic Formulas List(AFL)和Martinez&Schmitt(2012)编撰的短语表达表Phrasal Expressions List(PHRASE List)。因为这类词汇表涵盖日常英语中使用频率最高的语块,组建语块的单词数不超过5个,故本文暂通称为“常用短语表”或简称为“短语表”。表l为AFL和PHRA SE List的大致隋况介绍。从表1可见,两类短语表所列的常用短语数量相仿,它们的来源语料库都非常庞大,AFL直接从超过4百万词数的学术性(子)语料库中挑选;而PHRASE List从更为庞大的超过1亿词数的英国国家语料库中挑选。但是,这两类语料库编撰的目的不尽相同。AFL的编撰是为了满足学术性英语教学,尤其是学术英语课程(EnglishFor Academic Purpose)的需求,它是Coxhead(2000)所编撰的学术生单词表(AWL)的有效补充。而PHRA SE List的使用范围更为广泛,它不仅包括了学术性使用的目的,也为更广泛的日常英语教学提供了一个平台。“它的使用目的包括(但不局限于):为语言教学者和学习者提供学习语块的引导;为评估二语习得者的语块知识和语块接受能力提供平台;为监控词汇习得进程提供辅助” (Martinez&Schmitt,2012:302)。
从语块结构来看,AFL和PHRA SE List的语块长度稍有差异。AFL不含2个单词组成的语块,因为Simpson.Vlach&Ellis(2010)认为,二词短语基本上包含于多词短语中,例lmake use实际上已经包含于make use ofg个语块。
2.AFL和PHRA SE List的编撰需要重点指出的是,两类短语表的编撰过程存在较大的差异。AFL的语块筛选过程主要依赖于计算机信息技术。首先AFL课题组用Collocate件从学术性语料库和对比功能的非学术性语料库中提取3~5词的n元结构词串(n.gram),并利用计算机的对数似然比(1og.1ikelihood ratio)统计技术,把学术性语料库语块和非学术性语料库语块进行对比,在p=0.O1的显着性水平条件下,挑选出2000多个学术性口语短语、2000多个学术性书面语短语以及一定量的综合性学术性核心短语。然后,课题组根据频率和分布度来筛选这些语块:
设定口语短语的筛选标准为学术口语语料库中每百万词中共现频率不小于10个词项(token)或者在5类学科子语料库中分布度不少于4类;设定书面语短语的标准为学术性书面语语料库中每百万词中共现频率不小于10次或者在4类学科子语料库中的分布度不小于3类;设定核心短语标准为两类语料库中每百万词中共现频率不小于l0次或者在9类子语料库中的分布度不小于6类。按此标准,课题组进一步筛选出979个口语短语,712个书面语短语和207个核心短语。在最后的筛选中,AFL课题组利用了互信息技术(Mutual Information)和频率筛选相结合的方法。互信息技术原本是用于信息科学的一种信息度量,用来评估两个事件集合的相关性。Simpson—Vlach&Ellis(2010)创造性地把它应用于词汇连贯性(Coherence)检验。Simpson—Vlach&Ellis(2010)指出,如果没有MI技术,单纯依靠频率筛选,筛选结果会出现大量例~fland this is等共现频率高、但是词汇连贯性弱的词串,这类短语没有独立的语用功能,不属于语块的范畴。反过来,如果单凭MI技术,则会大量出现使用频率不高~ItlUniversity of Michigan等专有名词或者科技术语的语块,失去其教学实用性。因此,Simpson.Vlach&Ellis(2010)认为,把MI和Frequency相结合,才能获得有教学价值的语块(Formula Teaching Worth)。课题组按照MI和频率高中低水平随机选择1 08个语块,然后聘请一组密西根大学具有2O年以上学术英语教学经验的教师按照标准为语块评分(5分制),1 08个语块相关性检验得出语块FTw值跟MI和Frequency的关联系数,并建立多元回归方程式FTW=p0.56MI+p0.31Frequency巨算出参数B值以后,每个语块按照这个方程式计算出各自的教学价值分,然后从高到低进行排列,并选取分值最高的200个口语短语、200个书面语短语,保留仅有的207个核心短语,确定这些短语为有教学价值的常用学术性短语。
与AFL不同的是,PHRASE List采用了计算机信息技术和人工挑选相结合的方法。Martinez&Schmitt(2012)课题组用计算机技术筛选语块的过程跟AFL的编撰过程类似,使用Wordsmith软件从超过1亿词次的英国国家语料库挑选区问为2~4词的词串,结果得到420万个词串。考虑到BNC中第5000词频为787次,为了使语块使用频率和wordlist前5000的单词词频一致,课题组用787作为语块使用频率筛选标准,共得15000个符合条件的词串。在此基础上,课题组组织经验丰富的以英语为母语的教学专家(具有40年以上英语教学经验的教学科研人员)开始逐个人工挑选。为了保证人工挑选过程公正合理,Martinez&Schmitt(2012:308~310)课题组制定出一套挑选标准,共分为核心标准和辅助标准:核心标准:a. 语块为语素对等单位(Morpheme Equivalent Unit)b.语块没有语义通明性(Not SemanticallyTransparent)C.语块有迷惑通明性(Dec ePtivelYTransparent)辅助标准:a.存在单个词可以作语块语义对等替换,比如put up with=tolerateb.学习者母 ':FilF、I容易导致语块的错误理解C.语块意思因语法结构而产生变化,如besupposed to和suppose todPsuppose的语义变化所有PHR AsE Listl~短语必须至少满足核心标准之一,当使用核心标准判断不明确时,辅助标准可以作为有力补充。经过课题组长期反复的挑选和评估,最终确定505个语块作为常用短语。
3.分析和讨论AFL的编撰原则是避免编撰过程中的人为主观性,虽然也有专业人员参与语块的教学价值评价,但其评价目的是为了建立多元回归模型。
最终决定语块的教学价值是回归方程计算数值而非人工评分。这种看似客观的评价体系最终结果还是会出现一些语块连贯性和使用频率都较高但缺乏实际教学价值的语块,比如出现在口语短语表中的blah blah blab和this is the就是属于这些语块。PHRASE List的语块挑选过程与AFL相比,虽然具有一定的主观性,但是笔者认为,这种人工挑选是非常必要的。PHRA SE List的人工挑选过程体现了Wray(2008)对语块的重新定义。
她将语块重新定义为“一个词或词串。该词串可以是完整的,也可以是含有空格的。该词或词串被当作一个语素来处理,它的意义不依赖其组成成分的组合” (Wray,2008:12)。在此定义基础上,PHRASE List摒弃了那些透明性强的语块。Martinez&Schmitt(2012)认为,类似于inthe morning的透明性语块(即学习者可以望文生义的语块)不会导致学习者对语块的理解困难,因此不作为学习者优先掌握的目标语块。这个筛选原则可以保证学习者重点掌握理解困难的非透明性语块。然而,笔者认为语块的透明性判断尚缺乏客观标准。语块透明与否只是一个连续体的两端,完全透明或者不透明的语块数量有限,多数语块处于这个连续体不同位置,目前还没有定量方法来确定准确计算语块透明性的数值,主要还是取决于人的主观判断。Martinez&Schmitt(2012)把迷惑透明性语块和容易受学习者母语影响而产生误解的语块作为重要挑选标准。这两类语块其实就是我们平时所言的“伪朋友”,是语块教学中的难点。迷惑透明语块是语块本身容易造成学习者因望文生义而产生的误解,比如every SO often的实际意思跟语块单词的组合意思大相径庭。容易受母语影响而产生误解的语块在英语中也很多,例j~lleat one’S words容易被汉语为母语的学习者理解为“食言” ,实际上该语块的意思是“收回前言”,表达歉意。然而,笔者认为,Martinez&Schmitt(2012)课题组是由英语为母语的人员组成的,对于语块是否会因二语习得者的母语影响导致误解,他们的判断可能缺乏准确性。即使相关人员中有精通汉语的人士,笔耕文化推荐期刊,也未必能保证编撰的语块不会导致母语为其他语言的学习者的误解,因为短语表是为所有英语为外语的--N习得者制定而非专门为中国人制定的。
此外,与AFL相比,PHRASE List的表格编排有其优越性。AFL的表格编排比较单一,除语块本身外,只有对应的频次和FTw指数,而PHRASE List~括的内容多样化。表2为PHRASEList名前五语块的截取段。从表2可见,PHRASE List表格编排把短语在不同语境中的分布考虑进去了。编排者用三星、两星、一星和“x”分别标注语块在该语境中使用频率高、次高、不高和不适用。PHRASE List的另外一个优势是,这些常用短语不仅准确标注其每百万词的使用频率,而且把语块使用频率和单词使用频率相融合,形成语块在BNC单词和语块使用频率的综合排名。表2的第一列就是语块和单词使用频率融合的综合排名,比如haVe to这个语块在BNC中使用频率排名107位。这种单词和语块的融合为词汇研究的进一步发展奠定了基础。美中不足的是,语块的语法标注尚待进一步改进和完善,比~flhave to这个语块包含了hasto,had to,having to 3类曲折变化,应该以词目[have]to的形式列出,以区分其他不含动词曲折变化的语块,例~Hused to。此外,为了让学习者明确每个词在语块中的功能,不妨在表格中添力口词性赋码(Tagging)。比女口take control of按照国际标准标注为vvi/nnl/io,以便学习者明确这个语块中每个词尤其是control的语法属性。
三、常用短语表对外语教学和研究的启示常用短语表的编撰在当前我国外语教学和研究日益成熟的背景下具有十分重要的参考意义。
当前二语词汇教学并不缺乏各种词典作为教学辅助材料,West(1953)和Coxhead(2000)各自编撰的GSL和AWL也早已广泛应用到词汇教学和测试中。但是短语表的编撰弥补了上述词汇表和词典的空白,它的研制不仅是GSL和AWL的有效补充,也对英语课本编撰、教学大纲制定、英语考试的设计和词汇能力测试建立了一个参考平台。因篇幅有限,笔者着重就短语表在EAP课程教学和语块能力测试中的应用展开讨论。
1.AFL在EAP中的应用发展学术英语课程(EAP)是我们当前大学英语改革的一项重要内容。蔡继刚、廖雷朝(2010)特别强调,我们大学英语的教学方向是学术英语,而不是人文类英语。非英语专业的大学生学习英语的一个主要目的就是提高用英语来表达观点、陈述材料、分析和批评事物的能力。
Simpson—Vlach&Ellis(2010)编撰的AFL除了按照核心学术短语、口语学术短语、书面语学术短语的顺序编排外,还提供了按照语用功能分类编排的版本。这个版本按照学术英语需求分成指示性表达(Referential Expressions)、立场观点表达(Stance Expressions)和语篇组织(DiscourseOrganizers)三大类,每一大类又细分为若干次类,每一次类分若干小类。这样的编排和学术英语教学安排大体是一致的,可以为学术英语教学提供重要参考。学术英语教师按照课程大纲,把常用语块加以句法整合,再辅以一定内容材料就可以制定出完善的教学材料。例如,在训练学生用英语做类比和对比时,可以先让学生在学术性阅读材料中找出表示类比和对比的短语和句子,教师根据短语表的Contrast and Comparison这类内容,及时地补充相关短语并通过示例要求学生加以模仿使用。至于在教学细节上如何安排,可以因人而异。不管采用何种教学法,学术性短语表都可以适时融入学术英语课堂教学。
2.短语表在词汇能力测试中的应用目前,词汇测试主要还停留在以单词为对象的词汇广度的测试,例如研究者把Nation&Coxhead(2002)研发的RANGE软件和BNC词频表或者AWL结合就可以有效评估二语产出性词汇的词汇量和丰富性。语块运用能力也是词汇能力的一个重要方面,语块运用能力跟单词运用能力一样,也分为接受性能力和产出性能力。学习者的语块接受性能力可用判断题或者改错题,产出性能力可用完形填空或者翻译题来评估。但是,目前研究者们的试卷多半是自行设计的,缺乏一定的理论依据和语块挑选标准。例如,曲典宁、邓军(2010)的研究证明了基于语料库的DPP语块习得模式有利于提高学习者的语块概括和产出能力。然而,研究者测试学生语块能力所使用的研究工具只是研究者设定的包含若干语块的2O个简单句和20个中翻英的句子,没有阐述为什么用这些语块而不是别的语块来测试学生的语块能力。楼捷(2011)为了验证网络语料库辅助的写作模式是否有助于提高学习者的语块运用能力所使用的研究工具是平均分布于BNC3个等级的核心词改编的语块改错和语块改写练习。但是BNC编撰的单词频率表不能体现该单词所扩展的语块频率和难易度,比如高频单词in和that所组合的in that就属于一定难度的低频书面语语块。
正如Martinez& Schmitt(2012:302)所言,“孤立的单词只是由这些单词组成语块冰山的一角”。短语表的编撰为语块能力测试提供了一个很好的参考标准,有利于提高语块测试工具的效度和信度。此外,考虑PHRASE List的语块频次排名是融合单词频次的综合排名,Martinez&Schmitt(2012:3l5)指出, “短语表的编制使得RANGE软件完全有潜力不只评估孤立单词,同时覆盖短语以便更精确地反映出学习者的词汇运用能力”。笔者相信,随着语块研究的日新月异,短语表广泛应用于词汇测试指日可待。
四、结论以AFL和PHRASE List为代表的常用短语表的编撰是计算机信息技术和语块理论相结合的产物。短语表的编撰过程对我国外语教学和研究具有重要的启发意义。同时,编撰成果为外语教学与研究提供了一个很好的平台。限于篇幅,本文仅从EAP课程教学和词汇测试角度介绍了如何发挥短语表的作用。我们应该看到,它们的应用范围很广,潜力也很大,其发挥的作用由教学研究者不同的目的决定。这些目的涵盖了教材编写、大纲制定、试卷设计、词汇评估等多个方面。另一方面,我们应该认识到,短语表有其各自的局限性。IIAFL和PHRASE List中都没有包含5词以上的短语。实际上,很多5词以上的短语搭配组合(例如come up with a good idea)在二语习得中更具有教学意义。其他例如“days ago,ages ago,years ago”等语块也因为各自的使用频次不够没有列入短语表,但是把这个半固定的短语(群) “-ago”提取出来,使用频率是非常高的。总之,短语表只是语块教学的重要参考,语块教学的成功主要还是取决于教师教学方式的提高和教学资源的合理运用。
本文编号:4856
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/4856.html