- · 《中国教育学刊》栏目设[06/29]
- · 《中国教育学刊》数据库[06/29]
- · 《中国教育学刊》收稿方[06/29]
- · 《中国教育学刊》投稿方[06/29]
- · 《中国教育学刊》征稿要[06/29]
- · 《中国教育学刊》刊物宗[06/29]
项目反应理论的Parscale软件实现*(2)
作者:网站采编关键词:
摘要:3.运行程序及展示结果 点击菜单栏的Run,包括四个阶段: (1)0阶段(phase 0),输入数据和准备分析,包括模型说明(model specifications)、校准参数(calibration para
3.运行程序及展示结果
点击菜单栏的Run,包括四个阶段:
(1)0阶段(phase 0),输入数据和准备分析,包括模型说明(model specifications)、校准参数(calibration parameters)、文件任务和规定(file assignments dispositions)。校准参数的结果主要包括:最大EM周期数、最大内部EM周期数、最大类别估计周期、最大条目参数估计周期数、EM周期的收敛标准、斜率的收敛标准、阈值的收敛标准等等。
(2)1阶段(phase 1),输出数据和计算条目统计量。条目汇总统计量(summary item statistics),给出每个条目的总人数、每个选项的人数及比例,见表1;条目参数估计值,给出每个条目的均数和标准差,所有条目的均数(31.922)和标准差(5.416),并计算出经典测量理论下的阈值参数(initial location)和区分度参数(initial slope),见表2。
表1 条目汇总统计量NAMEtotalNot presentOmitcategories510(0.0)0(0.0)12(2.7)86(19.1)183(40.6)159(35.3)11(2.4)000(0.0)0(0.0)23(5.1)102(22.6)159(35.3)149(33.0)18(4.0)?????????000(0.0)0(0.0)14(3.1)58(12.9)111(24.6)179(39.7)89(19.7)Cumul*130(3.2)609(15.0)1070(26.4)1411(34.8)839(20.7)
表2 条目参数估计值Block response meanS.D.*total score meanS.D.*Pearson & polyserial correlationinitial slopeinitial **.0820.956**………………** ....0634.488
(3)2阶段(phase 2),估计模型的条目参数。包括给出类别参数(category parameter)及其标准误;每个条目的参数估计值,包括区分度参数(slope)及标准误;阈值参数(location)及标准误,猜测参数(guessing)及标准误,条目拟合统计量的χ2值和P值,见表3。所有条目的猜测参数均为0,条目5的阈值参数最小(-2.376),条目3的阈值参数最大(0.578),所有条目阈值参数的平均数为-1.005,说明拟定的条目对患者而言偏容易。
表3 条目的参数估计值及条目拟合统计量ITEMslopeSElocationSEguessingχ.............137均数标准差
(4)3阶段(phase 3),估计被测试者的参数,包括每个被测试者的平均分类(mean category)、能力参数(ability)及标准误,见表4。这里的ability是根据IRT理论计算出来的能力参数,跟阈值参数的尺寸一致。
表4 被测试者的参数估计值IDgroupweightmean ..221-0....8910..4287???????.1110..4766
(5)显示图形。Parscale软件还提供了很多图形,运行完所有程序后,点击Run…Plot,显示了常见的图形,包括条目特征曲线(item characteristic curve,ICC),条目信息曲线(item information curves),总体信息曲线(total information curves)等。例如图1显示了条目0001的条目特征曲线;图2显示了总体信息曲线。同时显示所有条目的ICC,见图3;估计能力的直方图,见图4。
图1 条目0001的条目特征曲线
图2 总体信息曲线
图3 同时显示所有条目的ICC
图4 估计能力的直方图
小 结
Parscale软件功能强大,可以估计条目参数和被试者的能力参数,并展现多种图形,广泛用于多种模型,包括logistic 模型,Samejima模型,Master模型和广义部分评分模型等。RUMM 2030软件也可以用于分析多个模型[10];而Bilog-MG软件只能分析二分类条目(logistic 模型),不能分析多分类条目[11]。Parscale软件的实现需要编写语句,而RUMM 2030采用点击的操作模式;两种软件各有优缺点,相对而言,Parscale软件的语句容易出错,在一定程度上影响了它的使用。
[1] Castro SM,Trentini C,Riboldi J.Item response theory applied to the Beck Depression Bras Epidemiol,2010,13(3):487-501.
[2] French GA,Dodd recovery for the rating scale model using Outcome Meas,1999,3(2):176-199.
[3] 邹丹杰,伍霞.结构方程模型和IRT等级反应模型在人格量表项目筛选中的对比研究.内江师范学院学报,2014,29(12):52-56.
[4] 戴莹.基于GPCM的高中数学教师评价指标体系的调查与分析.数学的实践与认识,2013,43(9):37-43.
[5] 周群.基于论证的我国高考开发质量评价模型研究.华东师范大学,2011.
[6] Kopec JA,Sayre EC,Davis AM,et of health-related quality of life in arthritis:conceptualization and development of five item banks using item response Qual Life Outcomes,2006,4:33.
[7] Yang FM,Heslin KC,Mehta KM,et al.A comparison of item response theory-based methods for examining differential item functioning in object naming test by language of assessment among older Test Assess Model,2011,53(4):440-460.
[8] Fukuhara S,Wakita T,Yamada M,et of a short version of the visual function questionnaire using item-response One,2013,8(9):e.
[9] 林岳卿,张伟涛,方积乾.项目反应理论在医学量表条目筛选中的应用.中国医药导报,2014,11(5):155-158.
[10] 陈新林,侯政昆,林岳卿,等.应用RUMM2030软件实施条目反应理论.中国卫生统计,2016(5):896-898.
文章来源:《中国教育学刊》 网址: http://www.zgjyxkzz.cn/qikandaodu/2021/0216/594.html
上一篇:攻克文言文难关初探
下一篇:探生活之源 寻语文之趣