教育教学能力测试质量的GT和多面Rasch模型分析
发布时间:2017-08-22 18:40
本文关键词:教育教学能力测试质量的GT和多面Rasch模型分析
更多相关文章: 教育教学能力测试 概化理论 多面Rasch模型
【摘要】:目前国内外在教师资格认定过程中都比较重视对申请人的教育教学能力进行测试。教育教学能力测试的评分主要采用多个评分员对考生的表现进行打分。这种评分主观性较强,可能导致评分出现较大误差,直接影响到教育教学能力测试的公平性。 以往的研究很少对影响教育教学能力测试评分的因素进行深入的量化分析。本研究以概化理论和IRT中的多面Rasch模型为工具对某市教育教学能力测试的一批实测结果进行了分析,旨在对此项测试评分质量进行评估,分析其影响因素及其作用机制,为完善测试设计和评分培训提供依据。 研究结果表明: (1)两种分析工具对测试质量分析各有侧重点,具有较好的互补性,实际应用中在满足测量条件情况下可联合使用,或根据分析重点选择其一; (2)本次教育教学能力测试的可靠性程度尚有改进的空间,测试适用于相对决策,在做绝对决策时需谨慎; (3)影响当前测试结果的主要原因是评分员宽严程度不一和任务跨考生的不一致性; (4)通过增加评分员人数可以提高教育教学能力测试的精度,但增幅递减,当评分员人数为5时,,结果已经能够较好满足测试要求; (5)建议加强评分员评分的培训和指导,尤其注意对面试打分的针对性指导。长远考虑可建立专门的评分员队伍,尝试建立“评分员库”。
【关键词】:教育教学能力测试 概化理论 多面Rasch模型
【学位授予单位】:江西师范大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:G449
【目录】:
- 摘要3-4
- Abstract4-6
- 目录6-8
- 引言8-10
- 1 文献综述10-20
- 1.1 经典测量理论测试质量分析的方法与特点10-11
- 1.1.1 经典测量理论测试质量分析原理与应用10-11
- 1.1.2 经典测量理论测试质量分析的局限11
- 1.2 概化理论试质量分析的方法与特点11-13
- 1.2.1 概化理论的发展11-12
- 1.2.2 概化理论测试质量分析原理12-13
- 1.2.3 概化理论测试质量分析的特点与应用13
- 1.3 多面 Rasch 模型试质量分析的方法与特点13-18
- 1.3.1 多面 Rasch 模型的简介13-14
- 1.3.2 多面 Rasch 模型主要的分析指标14-16
- 1.3.3 多面 Rasch 模型的偏差分析16-17
- 1.3.4 多面 Rasch 模型测试质量分析特点与应用17-18
- 1.4 概化理论与多面 Rasch 模型的结合18-20
- 1.4.1 概化理论与多面 Rasch 模型的对比18-19
- 1.4.2 两者结合的优势与应用19-20
- 2 研究思路20-23
- 2.1 研究内容、目的与意义20-21
- 2.1.1 研究内容20
- 2.1.2 研究目标20
- 2.1.3 研究意义20-21
- 2.2 研究设计21-23
- 2.2.1 研究数据21
- 2.2.2 分析思路21-22
- 2.2.3 研究工具22-23
- 3 多元概化理论研究的结果23-30
- 3.1 G 研究23-24
- 3.2 D 研究24-28
- 3.2.1 D 研究中的方差分量与协方差分量的估计24-25
- 3.2.2 各测试任务全域分数估计的精度问题25
- 3.2.3 全域总分的测量精度研究25-26
- 3.2.4 各测试任务对总方差的贡献比例的研究26
- 3.2.5 改变评分员人数对测量精度的影响研究26-28
- 3.3 多元概化理论分析的讨论28-30
- 4 多面 Rasch 模型的分析结果30-40
- 4.1 数据与模型总体拟合检验30
- 4.2 考生能力的分析30-32
- 4.3 评分员宽严程度的分析32-33
- 4.4 任务难度的分析33-34
- 4.5 偏差分析34-38
- 4.5.1 评分员与考生的偏差分析34-35
- 4.5.2 评分员与任务的偏差分析35
- 4.5.3 考生与任务的偏差分析35-36
- 4.5.4 评分员、任务、与考生的偏差分析36-38
- 4.6 多面 Rasch 模型分析的讨论38-40
- 5 总讨论40-42
- 5.1 考生能力的评估40
- 5.2 影响教育教学能力测试的评分员因素40-41
- 5.3 影响教育教学能力测试的任务因素41
- 5.4 改进教育教学能力测试的一些启示41-42
- 6 研究结论42-43
- 参考文献43-48
- 致谢48-49
- 在读期间公开发表论文(著)及科研情况49
【参考文献】
中国期刊全文数据库 前10条
1 谭智;;应用Rasch模型分析英语写作评分行为[J];外语教学理论与实践;2008年01期
2 何江川;主观评分裁判员水平非参数评价方法的研究[J];吉林体育学院学报;2005年01期
3 李中权;孙晓敏;张厚粲;张立松;;多面Rasch模型在主观题评分培训中的应用[J];中国考试(研究版);2008年01期
4 关丹丹;;主观题评分质量的估计方法评述[J];中国考试(研究版);2008年10期
5 戴丽敏;袁德润;;当代美国教师资格认定考试的核心尺度及启示[J];教育测量与评价(理论版);2011年11期
6 赵德成;夏靖;;表现性评价在美国教师资格认定实践中的应用及其启示[J];外国教育研究;2008年02期
7 王跃武;朱正才;杨惠中;;作文网上评分信度的多面Rasch测量分析[J];外语界;2006年01期
8 李航;;基于概化理论和多层面Rasch模型的CET-6作文评分信度研究[J];外语与外语教学;2011年05期
9 孙海洋;;概化理论和多层面Rasch模型在建立“职前中学英语教师口语考试模型”中的应用[J];外语与外语教学;2011年05期
10 黄巍;;概化理论在企业人事测评中的应用[J];现代商业;2011年02期
本文编号:720795
本文链接:https://www.wllwen.com/jiaoyulunwen/wangluojiaoyulunwen/720795.html