当前位置:主页 > 教育论文 > 师范教育论文 >

大尺度教育测评中IRT等值方法的比较研究

发布时间:2019-02-28 12:54
【摘要】:世界各国和国际组织都把大尺度教育测评作为关注教育质量的有效方式。有效发挥大尺度教育测评的作用离不开对其测评技术和方法的深入研究。等值是大尺度教育测评中数据处理的重要方法,有助于实现测验的公平。研究采用共同题非等组设计,利用实际数据,比较3种等值方法(同时性校准、StockingLord分别校准方法和Mean-Mean分别校准方法)与2种分别校准链接方案(集中式链接、链式链接)的题目参数等值精度。结果显示:多题本共同题设计下,StockingLord方法的估计精度要高于Mean-Mean方法;Mean-Mean和StockingLord两种分别校准等值方法在集中式链接方案和链式链接方案中的参数估计精度都比同时性校准的精度高;在链式链接方案中,随着链接题本数量的增加,参数等值精度在下降,在集中式链接方案中等值精度则没有这样明显的规律;等值方法对精度的影响要大于链接方案对等值精度的影响。其中,不同等值方法虽然在不同研究中分别被采用过,但同时考虑不同题本链接方案在国内外均没有实证研究。此研究结果,既弥补了国内外有关多题本共同题设计下不同等值方法以及不同题本链接方案的实证研究的不足,也为我国相关大尺度教育测评的等值设计提供参考和实证依据,进而更好地实现测验的公平。
[Abstract]:All countries and international organizations regard large-scale education evaluation as an effective way to pay attention to the quality of education. The effective use of large-scale education evaluation can not be separated from the in-depth study of its evaluation techniques and methods. Equivalence is an important method of data processing in large-scale education evaluation, which is helpful to realize the fairness of the test. In this study, three equivalent methods (synchronous calibration, StockingLord calibration method and Mean-Mean calibration method) and two separate calibration link schemes (centralized link, centralized link) were compared by using non-equal group design of common problem and using actual data. Link) the equivalent precision of the title parameters. The results show that the estimation accuracy of StockingLord method is higher than that of Mean-Mean method. The precision of parameter estimation of Mean-Mean and StockingLord is higher than that of synchronous calibration in centralized link scheme and chain link scheme respectively. In the link scheme, with the increase of the number of link items, the equivalent precision of the parameters is decreasing, but in the centralized link scheme, the equivalent accuracy is not so obvious. The effect of the equivalent method on the accuracy is greater than that of the link scheme. Among them, although different equivalence methods have been adopted in different studies, there is no empirical study at home and abroad to consider the link schemes of different questions at the same time. The results of this study not only make up for the deficiency of domestic and foreign empirical research on different equivalence methods and link schemes under the common design of multi-topic books, but also provide reference and empirical basis for the equivalent design of the related large-scale education evaluation in our country. And then better realize the fairness of the test.
【作者单位】: 北京师范大学教育统计与测量研究所;北京师范大学发展心理研究所;北京师范大学认知神经科学与学习国家重点实验室;
【分类号】:G647

【参考文献】

相关期刊论文 前2条

1 焦丽亚;;基于IRT的共同题非等组设计中五种项目参数等值方法的比较研究[J];考试研究;2009年02期

2 谢小庆;对15种测验等值方法的比较研究[J];心理学报;2000年02期

【共引文献】

相关期刊论文 前10条

1 刘瑜;;对男大学生上肢力量类测验项目的等值研究[J];首都体育学院学报;2005年06期

2 谢小庆;;科学技术进步为高考改革带来新的可能性[J];湖北招生考试;2009年30期

3 鹿士义,余嘉元;当前HSK中若干值得进一步研究的课题探讨[J];汉语学习;2003年04期

4 孙恒;;大规模教育考试平行试卷的设计[J];教育科学;2011年06期

5 范晓玲;廖利国;;测验等值综述[J];科技信息;2009年34期

6 谢小庆;;HSK和MHK的等值[J];考试研究;2005年01期

7 谢小庆;;考试分数等值的新框架[J];考试研究;2008年02期

8 黎光明;张敏强;;全测验与锚测验题型分值比对等值误差的影响[J];考试研究;2009年03期

9 张晋军;张慧君;张铁英;符华均;黄贺臣;;新汉语水平考试HSK(六级)试卷难度控制研究[J];中国考试;2012年11期

10 贾志先;;基于聚类分析的锚测验等值样本选取方法研究[J];控制工程;2012年06期

相关会议论文 前1条

1 谢小庆;任杰;;HSK等值方法的改进[A];对外汉语教学的全方位探索——对外汉语研究学术讨论会论文集[C];2004年

相关博士学位论文 前2条

1 王汉卫;华语阅读测试论[D];暨南大学;2008年

2 罗莲;基于HSK数据对核等值法与其他等值方法的比较研究[D];北京语言大学;2008年

相关硕士学位论文 前10条

1 戴步云;题目难度分布和样本容量对两种CTT等值结果的影响[D];江西师范大学;2011年

2 熊建华;项目反应理论(IRT)中等值方法及其比较[D];江西师范大学;2002年

3 刘瑜;对上肢力量类测验项目等值的实证研究[D];扬州大学;2002年

4 王艳;基于项目反应理论的项目功能差异检验[D];北京语言大学;2006年

5 吴锐;含题组测验的IRT等值问题研究[D];江西师范大学;2007年

6 孙菡;基于项目反应理论的应征公民数学推理测验项目的初步编制[D];第四军医大学;2007年

7 刘江鹰;项目反应理论在大学英语分级测试题库建设中的应用[D];湖南大学;2008年

8 金微敏;英语专业四级考试等值化的优化设计[D];北京邮电大学;2008年

9 周世科;混合题型的IRT等值问题研究[D];江西师范大学;2008年

10 陈俊丽;核等值与其它等值方法的比较研究[D];北京语言大学;2008年

【相似文献】

相关期刊论文 前10条

1 曾彦;;论同时的相对性[J];钦州学院学报;2006年03期

2 易杰雄;刘荣;;沟通同时性、零距离与当代国际关系[J];江汉论坛;2007年05期

3 张三慧;;同时性的相对性与经典同时性[J];物理通报;2001年02期

4 杜经纬;杨光年;;SQL数据库同步技术的应用[J];文教资料;2006年02期

5 郑忆石;;唯科学的西方马克思主义社会形态观评析[J];湘潭大学学报(哲学社会科学版);2006年05期

6 卢春红;;同时性与“你”——论伽达默尔理解问题中的空·间性视角[J];浙江学刊;2010年06期

7 资中勇;孙习成;;具有主从关系的同时性表达[J];宁夏大学学报(人文社会科学版);2007年05期

8 张建勇,,李耐国;应加强对新兴学科───教育测评的研究和运用[J];解放军外国语学院学报;1995年03期

9 李润田;整体的同时性与教学过程中的顿悟[J];太原师范学院学报(社会科学版);1993年04期

10 陈建国;同时性真是相对的吗?[J];江西社会科学;1992年02期

相关会议论文 前10条

1 焦丽亚;辛涛;;基于IRT等值的共同题设计中五种题目参数等化方法的比较研究[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年

2 罗冠中;;IRT软件新发展与RUMM简介[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年

3 陈如冰;吴向东;;导热系数测试仪校准方法研究[A];江苏省计量测试学术论文集[C];2007年

4 李莉;;放射性电离真空计的校准方法[A];第十四届全国质谱分析和检漏会议·第九届全国真空计量测试年会摘要及论文集[C];2007年

5 李舒;;气容、滴定式碳硫联测仪校准方法[A];江苏省计量测试学会2006年论文集[C];2006年

6 张文东;王国衍;张丽芳;;木材水分仪校准方法研究[A];第八届全国气湿敏传感器技术学术交流会论文集[C];2004年

7 季智勇;;西门子ONCOR直线加速器多叶光栅故障维修与校准[A];2008年中华临床医学工程及数字医学大会暨中华医学会医学工程学分会第九次学术年会论文集[C];2008年

8 丁伏林;陈海燕;;线材测试仪的校准方法[A];江苏省计量测试学会2005年论文集[C];2005年

9 魏燕婷;钱健;;数字信号发生器的校准技术研究[A];2008年江苏省计量测试学术论文集[C];2008年

10 张娟;季学勤;董著勇;;直流电子负载校准方法的研究[A];2008年江苏省计量测试学术论文集[C];2008年

相关重要报纸文章 前10条

1 颜一;美“教育测评”领跑者看好中国市场[N];国际商报;2005年

2 张忠田 唐群;血液透析机有校准方法[N];健康报;2002年

3 记者  蔡韬;省纪委监察厅召开先进性教育测评会[N];黑龙江日报;2006年

4 记者 孟晓明;先进性教育测评:满意度99%[N];吐鲁番报(汉);2006年

5 郝建宇(高级工程师);狭义相对论自我否定剖析[N];北京科技报;2006年

6 徐风;角膜接触镜用校验镜片国际标准拍板[N];中国质量报;2005年

7 刘方雄;七○一所测量放大器国标通过评审[N];中国船舶报;2006年

8 ;学生考分与经济增长有关系吗[N];中国教师报;2006年

9 记者 冰梅;Harcourt 测评公司来华试水[N];计算机世界;2005年

10 郑武;让你的测试械检验更准确更可靠[N];中国包装报;2006年

相关博士学位论文 前10条

1 孙向东;基于单位元的大口径电磁流量计干校准方法研究[D];上海大学;2010年

2 丁彭;多灶性喉鳞癌的临床与分子生物学研究[D];复旦大学;2005年

3 高思田;计量型原子力显微镜的研究[D];天津大学;2007年

4 袁继敏;基于混沌和神经网络的时域参数测试研究及其在示波器中的应用[D];电子科技大学;2009年

5 蔡艳;群体水平的英语阅读问题解决能力评估及认知诊断[D];江西师范大学;2010年

6 徐巧玉;大型装备在线三维视觉测量系统关键技术研究[D];哈尔滨工业大学;2007年

7 何密;同时极化测量体制雷达的校准方法研究[D];国防科学技术大学;2012年

8 闫士举;基于C形臂手术导航关键技术研究及系统实现[D];上海交通大学;2008年

9 年桂君;抗同步攻击鲁棒性数字水印技术研究[D];吉林大学;2008年

10 陈华;基于数字散斑相关方法的视觉变形测量技术研究[D];哈尔滨工业大学;2008年

相关硕士学位论文 前10条

1 成芳芳;表示时间同时性的语法功能词[D];大连理工大学;2005年

2 郑岱;基于IRT展开模型的中学生学习焦虑综合量表的编制[D];湖南师范大学;2013年

3 毛艳;基于IRT展开模型中学生学习适应性测验的编制[D];湖南师范大学;2013年

4 张倩倩;IRT在《现代教育技术》题库构建中的应用[D];山东师范大学;2011年

5 李华群;基于IRT计算机自适应测试的研究[D];南昌大学;2010年

6 张婷婷;测验项目的评分和IRT中能力参数的估计[D];西南大学;2012年

7 曾凡梅;基于IRT的3-6年级多重成就测验的修订及湖南省区域性常模的建立[D];湖南师范大学;2012年

8 陈佳程;基于IRT模型的数学试题类型测验效果的研究[D];苏州大学;2013年

9 蔡理力;企事业人事测评的分析方法研究[D];华北电力大学(河北);2008年

10 丁鼎;短路瞬态大电流测试平台的校准方法研究[D];天津大学;2012年



本文编号:2431814

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/shifanjiaoyulunwen/2431814.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户19967***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com