汉语语用能力测试评分员效应的实证研究
本文关键词:汉语语用能力测试评分员效应的实证研究 出处:《广东外语外贸大学》2014年硕士论文 论文类型:学位论文
更多相关文章: 汉语语用能力 评分员效应 评分员比较 多层面分析
【摘要】:本文主要通过控制评分员变量,研究评分员的评分员效应,包括整理严厉度差异、与评分标准的交互作用、集中趋势以及与试题之间的交互作用,来探讨不同变量评分员之间的评分行为差异。总共有6位评分员及30位受试参与了该研究。在6位评分员当中,3位来自中国北方地区,3位来自南方地区,3位男性,3位女性。 研究结果显示,6位评分员的内部一致性信度都在可接受范围之内,但评分员间严厉度差异较大,存在18个严厉度层级。由于牵涉到了社会变量,评分员显示了较多且复杂的评分员---试题的交互作用。评分员组间也存在一定差异。其中,北方评分员相较于南方严厉,其中2位北方男评分员考察了考生的跨文化意识。对于陌生人,北方评分员相较南方评分员更为开放、热情。男评分员比女评分员更有等级、尊卑以及权力意识。 本研究得出以下结论,,对于汉语语用能力测试而言,评分员之间存在较大的差异,主要体现在社会变量上,因此对于评分员细致,有针对性的培训对于提高语用能力测试的信度和效度有非常重要的意义。同时,此次研究证明了使用定量及定性分析相结合来研究评分员效应的可行性,以多层面拉西模型的结果为依据,以此进行定性分析造成评分员效应的因素,对于提高评分员培训效果也有实践意义。
[Abstract]:This paper mainly studies the grader effect of the grader by controlling the variables of the grader, including finishing the severity difference, the interaction with the scoring standard, the concentration trend and the interaction between the grader and the test questions. A total of 6 raters and 30 participants participated in the study. Of the 6 raters, 3 were from northern China and 3 were from southern China. Three men and three women. The results showed that the internal consistency reliability of the six graders was within the acceptable range, but there was a large difference in severity among the graders, and there were 18 severity levels, because of the social variables involved. The raters showed the interaction of more and more complicated raters-questions. There were also some differences among the raters groups. Among them, the northern raters were more severe than the southern ones. Two northern male raters examined candidates' cross-cultural awareness. For strangers, northern graders were more open and enthusiastic than southern raters. Male graders were more rated than female raters. The sense of inferiority and power. This study draws the following conclusions, for the test of Chinese pragmatic competence, there is a great difference between the graders, mainly reflected in the social variables, so the graders are careful. Targeted training is of great significance in improving the reliability and validity of pragmatic competence testing. At the same time, this study has proved the feasibility of using quantitative and qualitative analysis to study the raters effect. On the basis of the results of the multi-level Rasi model, the qualitative analysis of the factors causing the effect of the grader is also of practical significance for the improvement of the training effect of the grader.
【学位授予单位】:广东外语外贸大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:H136
【相似文献】
相关期刊论文 前10条
1 毛世花;陈晓丽;;E-rater和句酷的对比研究及对提高大学生英语作文水平的启示[J];高等函授学报(哲学社会科学版);2012年05期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前1条
1 王跃;林向进;徐三中;;Quantitative Measures of Modic Changes in Lumbar Spine Magnetic Resonance Imaging[A];浙江省医学会骨科学分会30年庆典暨2011年浙江省骨科学学术年会论文汇编[C];2011年
相关重要报纸文章 前1条
1 杜明;RATER指数衡量客户满意度的标尺[N];中国企业报;2003年
相关硕士学位论文 前10条
1 张洁;用多层面Rasch模型分析做事测试的分数差异[D];浙江大学;2006年
2 谢丽君;语用能力测试中评卷人效应的研究[D];广东外语外贸大学;2013年
3 周曼芝;写作评分中评分员因素的多侧面Rasch模型分析[D];湖南大学;2007年
4 段然;基于多层面Rasch模型的CET-SET评分员效应研究[D];河北科技大学;2012年
5 郝静茹;大学英语分级测试作文评分中评分员偏差特征分析[D];湖南大学;2012年
6 师艳芹;大规模网上作文评分的信度研究[D];湖南大学;2009年
7 陈文捷;汉语语用能力测试评分员效应的实证研究[D];广东外语外贸大学;2014年
8 吕玲玲;大学英语口语机考三阅评分模式的可靠性研究[D];湖南大学;2012年
9 卢伟烈;教师评分员与非教师评分员对口语故事复述评分的对比研究[D];广东外语外贸大学;2013年
10 王利国;以RATER指数框架分析唐山地税系统纳税服务的改善[D];河北大学;2010年
本文编号:1397373
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/1397373.html