您好, 访客   登录/注册

影响口头语言测量的因素:文献综述

来源:用户上传      作者:

  摘要:熟人因素和测试环境等因素在口头语言测量中不可忽视。通过对LanguageTesting刊载学术文章的解读和分析,探讨了口头语言测试中,如何控制熟人因素和测试环境等因素。
  关键词:口头语言;测量;因素
  中图分类号:G623.31 文献标识码:A 文章编号:1000-8136(2009)26-0091-02
  
  为了研究口头语言测量的方法,我们在阅读相应文献基础上作出以下综述。所选文献为1999年-2004年之间发表在Language Testing期刊上的7篇文章。所涉文章涵盖了测试难度,例如Elder(2002),Fulcher和Reiter(2003)等;影响测试难度和表现的因素,例如Jennings(1999),Kormos(1999),O’Loughlin(2002),O’Sullivan(2002)和Vermeer(2000)等。为便于比较,表1总结了这些文章探讨的话题。
  
  1 影响测试题目难度的因素
  
  设计测试时,无论是为了研究还是一般教学而进行的测试,我们都需要关注其难度。Fuleher(2003)和Elder(2002)为研究测试任务的难度提供了参考。
  Fuleher(2003)评析了当前人们对测试任务难度的认识。Fulcher(2002)称,尽管Bachman(1990)提出了一套测试方法体系,但是并没有被用于研究任务难度。Skehan(1998,cited inFuleher 2003)也提出了影响测试表现的种种语言心理学范畴。Fuleher(2003)则提出了从测试任务的语用学特征和说话人的母语文化背景之间的相互关系来研究测试难度的方法。Fuleher(2003)发现社会权力和强加感(imposition)两个因素在某些母语文化背景的语言学生中间产生明显的影响。从设计测试任务的角度,我们从中可以了解到在某些极端的条件下,如社会地位悬殊时或明显存在强加感的时候,相应的测试任务难度就会加大。所以在设计测试任务时,应该避免这类极端条件,减少社会权力差异或强加感对口语发挥的影响。
  
  与Fuleher(2003)不同,Elder(2002)研究不同的口语测试环境对人们感觉到的测试难度有什么影口向。Eldeff2002)引用了Robinson(2001)提出的两类影响测试难度的因素。
  有趣的是Elder(2002)也讨论过Skehan(1998)的观点,引用了Skehan(1998)提出的认知复杂性理论(cognitive complexityframework)。尽管Elder(2002)试图运用Skehan(1998)的理论,但是其研究结果并不支持Skehan(1998)。Elder(2002)发现,人们往往认为不同的测试方法会有不同的难度,但是研究结果表明,测试参加者对任务难度的理解和设计人员对相应条件下任务难度的设想往往不吻合。也就是说,设计测试任务时完全可以设计多种任务,并且能够保证难度均匀。
  从以上两项研究看,测试任务的难度似乎是个不可捉摸的东西,可以受许多因素的影响。人们已知的影响因素往往在实验中并没有明显的表现,而且难以求得它们各自的权重。将来的数据搜集中不可避免地要面对测试难度的问题,并须从中确定主要的影响因素,尽量减小其影响。正如Elder(2002)总结:“难度受多个复杂而不稳定的因素影响,既包括测试任务的种种特性,又包括测试参加者各自的特点。”
  
  2 影响测试表现的因素
  
  2.1 Jennings(1 999)开篇就提到了测试的话题对于测试参加者的影响
  该研究的主要研究问题是“确定测试话题可选与否对口语测试表现有无影响”。Jennings(1999)文中,这两种测试环境并没有发现明显的不同;然而,可选话题一组的测试者平均分高于参照组。该研究针对测试参加者的调查问卷也显示,参加者认为提供可选话题与否是一项重要的因素。
  基于测试参加者的书面反馈,Jennings(1999)提出,测试参加者们能否选出最适合发挥自己水平的题目。也就是说,设计测试任务时须认识到,一方面,提供可选题目能够减少话题效应,另一方面,还应该考虑到测试参加者能否作出最有利的选择。
  
  2.2Kormos(1999)通过话语分析的方法比较了角色扮演和访谈两种测试方法
  该研究比较两种测试环境下测试参加者和测试人员提出和认可的话题数目,以及他们各自的开始会话、结束会话等会话行为。研究结果表明,在角色扮演测试环境下,如果测试参加者和测试员提出几乎相同数目的话题,也就是说,角色扮演测试环境比访谈更像日常对话;同时,在角色扮演中,测试参加者能更有效地打断对方,也能更有效地掌握话轮。
  Kormos(1999)认为,在访谈型测试中,测试参加者和测试员的地位并不平等;而在角色扮演测试中,测试与被测人员双方的地位则相对平等,而且交流也更平衡,有利于测量测试参加者的会话能力。
  我们设计二语习得的口语测量工具时可以参考Kormos(1999):尽量将测试和被测双方置于平等的地位,减少地位差别或悬殊对口语测试的影响。Kormos(1999)中还揭示了,在为了测量某些因素而进行的访谈中,参加者如果意识到测试的目的,可能取悦测试人员(mtbjeot expectancy)等人为因素。
  
  2.3 关于性别差异对语言产出和测评可能产生的影响。O’Loughlin(2002)进行了研究
  O'Loughlin(2002)发现先前的研究都认为:性别差异在话语交谈中有明显的表现。人们认为,典型的女性会话风格是合作、趋同、话语双方地位平等;而男性的会话风格是控制欲,话语双方地位不平等。然而,研究结果并不支持这些的传统观念,O’Loughlin(2002)认为性别可能与说话人的社会地位、角色以及交谈的环境共同起作用。
  O’Loughlin(2002)在结论部分说因性别而产生的产出和测评差别并非不可避免。这也就是说,我们设计测试时能够并且应该尽量减少因性别产生的影响。
  O’Loughlln(2002)的数据搜集活动中,无论是测试参加者还是测试人员,他们在开始测试前的组织方式有利于各自放松,正常发挥:测试要求他们做自我介绍,交流各自兴趣;另外,测试参加者还可以选择测试题目的话题。这种组织方式尽量减少了测试参加人员的情感因素。
  
  2.4 O’Sullivan(2002)研究口语小组测试中的熟人因素
  在实验中,O’Sullivan(2002)相应地将32名日本学生分别进行了3项测试,个人信息交流、故事简述、商讨决策等。这3项测试都是先分别与自己的朋友成对完成,然后与陌生人成对完成。所有的表现都有录像记录,由有经验的测试员打分,最后转写为文字以便分析。研究结果表明,与朋友成对完成任务的测试参加者得分较高。然而,分析了他们的语言产出后作者发现语言的语法复杂程度似乎没有受到影响。另外,研究还发现性别也会影响测试的表现。
  该研究中作者使用了多种测试任务,如Skehan(1998)称,不同的测试任务可能产生不同的测试表现,因而作者认为3项不同的测试任务获得的数据要比单纯依赖一种测试任务更有说服力。
  
  2.5 Vermeer(2000)研究的是自发口语产出(spontaneousspeech)中的词汇丰富性问题
  该文章对型符比(Type/Token Ratio,简写作TTR)用于测量词汇丰富性的效度和信度进行了研究,并提到型符比(TrR)是广泛运用于第一、第二语言习得中的研究手段(Vermeer,2000)。作者的研究发现在语言习得的初期,型符比(TTR)能够较好地测量学习者口语词汇的丰富性;但在语言习得的后期,型符比(TTR)就不再能够反映学习者知道懂得哪些词汇了,型符比(ITR)只是一个比率。
  相反,Vermeer(2002)指出我们可以用学习者口语输出词汇的难度来衡量他们语言的词汇丰富性。口语输出词汇的难度可以用这些词汇在学习者口语语料库中的频率来计算。Vermeer的观点对于我们测量学习者的口语产出水平,特别是二语习得研究中口语数据搜集,有参考意义:可以求得其口语词汇的丰富性。并据此区分学习者的目标语学能力。
  
  3 结论
  
  本文综述的文章都对研究工具和测试方法本身进行了批判性分析。探讨的话题被Baclunan(1990)划定为顽症(persistentproblems)。Bachman(1990)在书中把这些因素笼而统之放入个人特点中,或者归入测试方法之下。然而我们作为研究者,无论是进行测试设计还是进行搜集二语语料,都须研究这些问题,借鉴论文的研究成果,尽量控制其中的无关因素。
转载注明来源:https://www.xzbu.com/8/view-9123695.htm