分类: 心理学 >> 社会心理学 提交时间: 2023-03-27 合作期刊: 《心理学报》
摘要: 相对于传统的离散作答数据, 作答时间作为连续数据, 可以提供更多信息。改变点分析(change point analysis)技术在心理和教育领域是一个比较新的技术。本文一方面对改变点分析在心理测量领域的应用进行了一个综合的总结和分析; 另一方面, 将基于作答数据的两种改变点分析统计量推广到作答时间数据, 将改变点分析技术应用到测验异常作答模式:加速作答speededness的检测上。采用两种检验方法:似然比检验和Wald检验, 分别在已知和未知项目参数的条件下, 实现异常作答模式的检测。结果表明, 所采用的方法对于加速作答行为的检测具有很高的检验力, 同时能够很好的控制I类错误率。实证数据分析进一步表明本文中所使用的方法具有应用价值。
分类: 心理学 >> 社会心理学 提交时间: 2023-03-27 合作期刊: 《心理学报》
摘要: 多级属性是将诊断测验中传统的二值(即两种水平, 通常定义为0和1)属性定义为多值(多个水平可以为0, 1, …), 它不但可以描述学生对于知识属性是否掌握, 而且可以描述学生在属性上的掌握程度, 这样使得诊断测验能提供给被试更丰富的知识掌握详情。本文将适用于二级属性Q矩阵的统计量(S统计量)拓展到多级属性下的Q矩阵验证和估计, 在两种常见的条件下, 设计了两种估计算法:联合估计算法和在线估计算法。模拟实验结果表明:联合估计算法适用于对专家界定的初始Q矩阵进行验证, 当初始Q矩阵中包含较少的错误时, 通过联合估计算法有很大可能恢复正确的Q矩阵; 在线估计算法适用于对“新项目”进行属性向量和项目参数的在线标定, 基于一定数量的“基础项目”, 在线估计算法对于新项目的估计也能达到较满意的成功率。实证数据分析则进一步展示了该方法的使用。
分类: 心理学 >> 社会心理学 提交时间: 2023-03-27 合作期刊: 《心理学报》
摘要: 本文提出一种多级计分项目下的个人拟合统计量R, 考察它在检测6种常见的异常作答模式(作弊、猜测、随机、粗心、创新作答、混合异常)下的表现, 并与标准化对数似然统计量lzp进行比较。结果表明:(1) 在异常作答覆盖率较低并且异常作答类型为作弊和猜测时, R的检测率显著高于lzp; (2) 随着测验长度和被试异常程度的增加, 两种统计量的检测率都会上升; (3) 在一些条件下, R与lzp检测效果接近。实证数据分析进一步展示了R统计量的使用方法和过程, 结果也表明R统计量具有较好的应用前景。
分类: 心理学 >> 心理测量 提交时间: 2022-05-26
摘要: 多级属性是将诊断测验中传统的二值(即两种水平,通常定义为0和1)属性定义为多值 (多个水平可以为0,1,),它不但可以描述学生对于知识属性是否掌握,而且可以描述学生在属性上的掌握程度,这样使得诊断测验能提供给被试更丰富的知识掌握详情。本文将适用于二级属性Q矩阵的统计量 (S 统计量)拓展到多级属性下的Q矩阵验证和估计,在两种常见的条件下,设计了两种估计算法:联合估计算法和在线估计算法。模拟实验结果表明:联合估计算法适用于对专家界定的初始Q矩阵进行验证,当初始Q矩阵中包含较少的错误时,通过联合估计算法有很大可能恢复正确的Q矩阵;在线估计算法适用于对新项目进行属性向量和项目参数的在线标定,基于一定数量的基础项目,在线估计算法对于新项目的估计也能达到较满意的成功率。实证数据分析则进一步展示了该方法的使用。
分类: 心理学 >> 心理测量 提交时间: 2022-05-14
摘要: 相对于传统的离散作答数据,作答时间作为连续数据,可以提供更多信息。改变点分析(change point analysis)技术在心理和教育领域是一个比较新的技术。本文一方面对改变点分析在心理测量领域的应用进行了一个综合的总结和分析;另一方面,将基于作答数据的两种改变点分析统计量推广到作答时间数据,将改变点分析技术应用到测验异常作答模式:加速作答speededness的检测上。采用两种检验方法:似然比检验和Wald检验,分别在已知和未知项目参数的条件下,实现异常作答模式的检测。结果表明,所采用的方法对于加速作答行为的检测具有很高的检验力,同时能够很好的控制I类错误率。实证数据分析进一步表明本文中所使用的方法具有应用价值。
分类: 心理学 >> 心理测量 提交时间: 2022-05-12
摘要: 当前大多数CD-CAT有关的研究都是基于0-1计分的数据资料展开的,而在实际的教育与心理测验中,还包含大量称名反应数据。本文基于称名反应认知诊断模型(NR-cRUM)开发了适用于称名反应数据的CD-CAT(以下简称NCD-CAT),并将7种0-1计分CD-CAT的选题方法引入NCD-CAT中。比较不同条件下,不同选题方法对被试判准率和测验效率的影响。结果表明NR_PWCDI、NR_MPWKL等PWKL系新方法和NR_SHE/MI方法能较好地适用于NCD-CAT,且在大多数条件下优于基线方法NR_PWKL。研究拓展了称名多级计分CD-CAT的选题方法。
分类: 心理学 >> 心理测量 分类: 心理学 >> 心理统计 分类: 心理学 >> 教育心理学 提交时间: 2022-05-12
摘要: 通常情况下,认知诊断需要通过认知诊断模型对被试进行诊断评价。认知诊断模型所生成的诊断结果的有效性依赖于被试作答反应是否与所选用的模型拟合。因此,在对诊断结果进行评估的时候,需要通过被试拟合分析来对被试个体的作答反应与模型的拟合情况进行检验,以避免错误或无效的补救措施。本研究基于加权的得分残差,提出认知诊断评价中新的被试拟合指标R 。模拟研究结果表明,R 指标的一类错误率有较好的稳定性,对随机作答、疲劳、睡眠和创造性作答四种异常被试类型均有较高的统计检验力。并将R 指标应用于分数减法实证数据,展示R 指标在实际测验中的使用过程。
分类: 心理学 >> 心理测量 分类: 心理学 >> 心理统计 提交时间: 2022-04-06
摘要: 本文提出一种多级计分项目下的个人拟合统计量R ,考察它在检测6种常见的异常作答模式(作弊、猜测、随机、粗心、创新作答、混合异常)下的表现,并与标准化对数似然统计量lzp 进行比较。结果表明:(1) 在异常作答覆盖率较低并且异常作答类型为作弊和猜测时,R 的检测率显著高于lzp ;(2) 随着测验长度和被试异常程度的增加,两种统计量的检测率都会上升;(3) 在一些条件下,R 与lzp 检测效果接近。实证数据分析进一步展示了R 统计量的使用方法和过程,结果也表明R 统计量具有较好的应用前景。