共同总体假设下基于虚拟人的测验等值研究
发布时间:2022-05-08 09:27
在大规模教育测验中,为了测试题本的安全以及减少学生的作答时间,同一测验项目中需要构建多份不同形式的测试题本。不同考生可能作答的测试题本不一样,这样得到的分数不具有可比性。以浙江英语高考为例,通过控制每年两次的试题难度不变,使参加不同测验的考生成绩具有可比性。目前我国高考试题难度控制主要依赖于命题专家多年的经验,但是2018年浙江英语高考事故充分说明了经验并不完全可靠,以此控制试题难度是困难的。因此我们通过对测验结果进行等值,使得参加不同测验的考生成绩可比。国外对等值的研究和运用已经较为成熟,较为常用的方法是通过在测验中加入锚测验进行测验等值。但是以我国高考为例,试题施测以后便不再具有保密性,锚题曝光的必然性严重威胁到锚题设计的有效性,因此本文提出引入共同虚拟人的做法,在无锚题情况下进行测验等值。本文分为三个研究,全部基于共同总体假设。研究一和研究二分别在经典测验理论(Classical Test Theory,CTT)和项目反应理论(Item Response Theory,IRT)框架下进行有无共同虚拟人对等值稳定性影响的研究,研究三通过比较不同共同虚拟人比例下60次抽样IRT等值分...
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 前言
2 文献综述
2.1 等值概述
2.1.1 等值条件
2.1.2 等值设计
2.2 等值理论
2.2.1 经典测验理论
2.2.2 项目反应理论
2.3 虚拟样本
2.4 等值评价标准
3 研究设计与数据
3.1 研究设计
3.2 符号说明
3.3 数据准备
3.3.1 模拟数据生成
3.3.2 实证数据来源
3.3.3 虚拟人数据生成
4 研究一:虚拟人在CTT下对等值影响研究
4.1 研究目的
4.2 研究假设
4.3 研究方法
4.3.1 模拟研究
4.3.2 实证研究
5 研究二:虚拟人在IRT下的等值影响研究
5.1 研究目的
5.2 研究假设
5.3 研究方法
5.3.1 模拟研究
5.3.2 实证研究
6 研究三:IRT下共同虚拟人比例对等值的影响
6.1 研究目的
6.2 研究假设
6.3 研究方法
6.3.1 模拟研究
6.3.2 实证研究
7 研究结论与展望
7.1 研究结论
7.2 展望
参考文献
致谢
【参考文献】:
期刊论文
[1]基于Bootstrap方法的等百分位等值误差分析[J]. 杜海燕,李付鹏,宋吉祥. 教育测量与评价. 2018(09)
[2]中国英语听力能力等级量表描述语效度验证——基于学生自我评价的多级计分IRT模型分析[J]. 闵尚超,何莲珍,罗蓝. 中国外语. 2018(02)
[3]等百分位等值方法的理论与考试应用研究[J]. 宋吉祥,李付鹏,杜海燕. 考试研究. 2017(03)
[4]线性等值与等百分位等值的实施条件与步骤[J]. 杨志明. 教育测量与评价. 2016(12)
[5]IRT理论不同模型下同时校准等值方法的跨样本研究[J]. 张泉慧,黄慧英. 中国考试. 2016(02)
[6]无铆题情况下测验分数等值方法探索——构造铆测验法[J]. 刘玥,刘红云. 心理科学. 2015(06)
[7]高考数学中考试评价的研究——基于CTT与IRT的实证比较[J]. 闫成海,杜文久,宋乃庆,张健. 华东师范大学学报(教育科学版). 2014(03)
[8]不同定义平行测验等值的群体不变性[J]. 刘铁川,戴海琦,赵玉. 心理学探新. 2012(01)
[9]垂直等值的应用及最新发展述评[J]. 王烨晖,边玉芳,辛涛. 心理学探新. 2011(05)
[10]基于RSM对Q矩阵相同的无锚题测验的等值[J]. 高慧健,辛涛,李峰. 心理科学. 2011(04)
硕士论文
[1]基于锚测验的几种新的等值方法[D]. 裴博阳.东北师范大学 2014
[2]经典测量理论与题目反应理论结合的模拟研究[D]. 常蕤.华南师范大学 2003
[3]项目反应理论(IRT)中等值方法及其比较[D]. 熊建华.江西师范大学 2002
本文编号:3651391
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 前言
2 文献综述
2.1 等值概述
2.1.1 等值条件
2.1.2 等值设计
2.2 等值理论
2.2.1 经典测验理论
2.2.2 项目反应理论
2.3 虚拟样本
2.4 等值评价标准
3 研究设计与数据
3.1 研究设计
3.2 符号说明
3.3 数据准备
3.3.1 模拟数据生成
3.3.2 实证数据来源
3.3.3 虚拟人数据生成
4 研究一:虚拟人在CTT下对等值影响研究
4.1 研究目的
4.2 研究假设
4.3 研究方法
4.3.1 模拟研究
4.3.2 实证研究
5 研究二:虚拟人在IRT下的等值影响研究
5.1 研究目的
5.2 研究假设
5.3 研究方法
5.3.1 模拟研究
5.3.2 实证研究
6 研究三:IRT下共同虚拟人比例对等值的影响
6.1 研究目的
6.2 研究假设
6.3 研究方法
6.3.1 模拟研究
6.3.2 实证研究
7 研究结论与展望
7.1 研究结论
7.2 展望
参考文献
致谢
【参考文献】:
期刊论文
[1]基于Bootstrap方法的等百分位等值误差分析[J]. 杜海燕,李付鹏,宋吉祥. 教育测量与评价. 2018(09)
[2]中国英语听力能力等级量表描述语效度验证——基于学生自我评价的多级计分IRT模型分析[J]. 闵尚超,何莲珍,罗蓝. 中国外语. 2018(02)
[3]等百分位等值方法的理论与考试应用研究[J]. 宋吉祥,李付鹏,杜海燕. 考试研究. 2017(03)
[4]线性等值与等百分位等值的实施条件与步骤[J]. 杨志明. 教育测量与评价. 2016(12)
[5]IRT理论不同模型下同时校准等值方法的跨样本研究[J]. 张泉慧,黄慧英. 中国考试. 2016(02)
[6]无铆题情况下测验分数等值方法探索——构造铆测验法[J]. 刘玥,刘红云. 心理科学. 2015(06)
[7]高考数学中考试评价的研究——基于CTT与IRT的实证比较[J]. 闫成海,杜文久,宋乃庆,张健. 华东师范大学学报(教育科学版). 2014(03)
[8]不同定义平行测验等值的群体不变性[J]. 刘铁川,戴海琦,赵玉. 心理学探新. 2012(01)
[9]垂直等值的应用及最新发展述评[J]. 王烨晖,边玉芳,辛涛. 心理学探新. 2011(05)
[10]基于RSM对Q矩阵相同的无锚题测验的等值[J]. 高慧健,辛涛,李峰. 心理科学. 2011(04)
硕士论文
[1]基于锚测验的几种新的等值方法[D]. 裴博阳.东北师范大学 2014
[2]经典测量理论与题目反应理论结合的模拟研究[D]. 常蕤.华南师范大学 2003
[3]项目反应理论(IRT)中等值方法及其比较[D]. 熊建华.江西师范大学 2002
本文编号:3651391
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3651391.html