分类: 心理学 >> 社会心理学 提交时间: 2023-03-27 合作期刊: 《心理学报》
摘要: 科学素养是指作为一名有反思意识的公民所具有的解决科学问题和运用科学理念的能力。为实现在认知诊断中对科学素养的测评, 本文基于PISA 2015科学素养测评框架首次提出科学素养包含的三阶潜在结构, 使用新提出的多阶认知诊断模型对PISA 2015科学测评数据进行分析, 并通过模拟研究探究新模型的心理测量学性能。结果表明:(1)新模型能够较好地分析包含三阶潜在结构的科学素养; (2)科学知识对科学素养的影响最大, 科学背景次之, 科学能力的影响最小; (3)全贝叶斯MCMC算法能够为新模型提供较精准的参数估计。
分类: 心理学 >> 心理测量 分类: 心理学 >> 教育心理学 提交时间: 2019-02-14
摘要: 科学素养是指作为一名有反思意识的公民所具有的解决科学问题和运用科学理念的能力。为实现在认知诊断中对科学素养的测评,本文基于PISA 2015科学素养测评框架首次提出科学素养包含的三阶潜在结构,使用新提出的多阶认知诊断模型对PISA 2015科学测评数据进行分析,并通过模拟研究探究新模型的心理测量学性能。结果表明:(1)新模型能够较好地分析包含三阶潜在结构的科学素养;(2)科学知识对科学素养的影响最大,科学背景次之,科学能力的影响最小;(3)全贝叶斯MCMC算法能够为新模型提供较精准的参数估计。
分类: 心理学 >> 社会心理学 提交时间: 2023-03-27 合作期刊: 《心理学报》
摘要: Q矩阵的正确性是影响题目参数估计和被试分类准确性的重要因素。针对Q矩阵修正问题, 首先提出了一种简单有效的新方法(ORDP)。然后, 模拟研究通过改变被试知识状态的分布、样本容量(N)、测验长度(L)、Q矩阵错误率(M)、项目质量(Iq)和属性层级结构, 比较了ORDP与已有方法(R、RMSEA和HD)的表现。研究表明:(1) 当知识状态服从均匀分布时, ORDP方法在所有层级结构下最优; 当知识状态服从多元正态分布时, RMSEA和ORDP表现没有明显差异, 除独立结构外, RMSEA方法均稍优于ORDP方法; (2) 各方法在多元正态分布下的修正效果不及均匀分布时的修正结果; (3) N、L、M、Iq和属性层级结构对4种方法的表现均有明显影响; (4) 基于Tatsuoka (1984)分数减法数据的修正结果表明, 采用ORDP方法修正的Q矩阵与数据拟合最优。
分类: 心理学 >> 社会心理学 提交时间: 2023-03-27 合作期刊: 《心理学报》
摘要: 多级属性是将诊断测验中传统的二值(即两种水平, 通常定义为0和1)属性定义为多值(多个水平可以为0, 1, …), 它不但可以描述学生对于知识属性是否掌握, 而且可以描述学生在属性上的掌握程度, 这样使得诊断测验能提供给被试更丰富的知识掌握详情。本文将适用于二级属性Q矩阵的统计量(S统计量)拓展到多级属性下的Q矩阵验证和估计, 在两种常见的条件下, 设计了两种估计算法:联合估计算法和在线估计算法。模拟实验结果表明:联合估计算法适用于对专家界定的初始Q矩阵进行验证, 当初始Q矩阵中包含较少的错误时, 通过联合估计算法有很大可能恢复正确的Q矩阵; 在线估计算法适用于对“新项目”进行属性向量和项目参数的在线标定, 基于一定数量的“基础项目”, 在线估计算法对于新项目的估计也能达到较满意的成功率。实证数据分析则进一步展示了该方法的使用。
分类: 心理学 >> 心理测量 提交时间: 2022-05-26
摘要: 多级属性是将诊断测验中传统的二值(即两种水平,通常定义为0和1)属性定义为多值 (多个水平可以为0,1,),它不但可以描述学生对于知识属性是否掌握,而且可以描述学生在属性上的掌握程度,这样使得诊断测验能提供给被试更丰富的知识掌握详情。本文将适用于二级属性Q矩阵的统计量 (S 统计量)拓展到多级属性下的Q矩阵验证和估计,在两种常见的条件下,设计了两种估计算法:联合估计算法和在线估计算法。模拟实验结果表明:联合估计算法适用于对专家界定的初始Q矩阵进行验证,当初始Q矩阵中包含较少的错误时,通过联合估计算法有很大可能恢复正确的Q矩阵;在线估计算法适用于对新项目进行属性向量和项目参数的在线标定,基于一定数量的基础项目,在线估计算法对于新项目的估计也能达到较满意的成功率。实证数据分析则进一步展示了该方法的使用。
分类: 心理学 >> 心理测量 分类: 心理学 >> 心理统计 分类: 心理学 >> 教育心理学 提交时间: 2022-05-12
摘要: 通常情况下,认知诊断需要通过认知诊断模型对被试进行诊断评价。认知诊断模型所生成的诊断结果的有效性依赖于被试作答反应是否与所选用的模型拟合。因此,在对诊断结果进行评估的时候,需要通过被试拟合分析来对被试个体的作答反应与模型的拟合情况进行检验,以避免错误或无效的补救措施。本研究基于加权的得分残差,提出认知诊断评价中新的被试拟合指标R 。模拟研究结果表明,R 指标的一类错误率有较好的稳定性,对随机作答、疲劳、睡眠和创造性作答四种异常被试类型均有较高的统计检验力。并将R 指标应用于分数减法实证数据,展示R 指标在实际测验中的使用过程。
分类: 心理学 >> 心理测量 提交时间: 2023-11-22
摘要: G-DINA (the generalized deterministic input, noisy and gate)模型限制条件少,应用范围广,满足大量心理与教育评估测验数据的要求。研究提出一种适用于G-DINA等模型的同时标定新题Q矩阵与项目参数的认知诊断计算机化自适应测验(CD-CAT)在线标定新方法SCADOCM,以期促进CD-CAT在实践中的推广与应用。本研究分别基于模拟题库以及真实题库进行研究,结果表明:相比传统的SIE方法,SCADOCM在各实验条件下均具有较为理想的标定精度与标定效率,应用前景较好;SIE方法不适用于饱和的G-DINA等模型,其各实验条件下的Q矩阵标定精度均较低。