分类: 心理学 >> 心理测量 提交时间: 2025-04-11
摘要: 心理测验、教育测验和医学测验广泛应用于测试者分类,而内部一致性和α等信度系数并不能直接评价分类信度,如何评估标准参照测验的分类信度,成为研究者和实践者关注的重要问题。本研究从分类一致性方法视角,探究单次施测测验的分类一致性估计模式,分析各类代表性方法发展脉络及其核心思想,结合各方法相关软件包与程序,分析人格测验、学业测验、诊断测验等真实数据。结合理论分析与数据分析,总结各类方法的优劣与影响因素,提出选用各类方法的建议,讨论分类一致性区间估计等问题,推动分类测验的分类一致性的研究、应用与报告。
分类: 心理学 >> 心理测量 提交时间: 2025-04-06
摘要: 在交互式问题解决测验中,问题情境不是一次性呈现完整,被试需要进行探索逐渐积累信息。这使得被试当前状态的行为选择,不仅受到其问题解决能力的影响,还受到其对问题情境的了解程度的影响(即学习效应)。针对现有模型方法的缺陷,在单参数行动序列模型(1P-ASM)的基础上引入当前状态在作答序列中的位置这一变量,对被试在问题解决过程中的学习效应进行建模,提出考虑学习效应的1P-ASM拓展模型(1P-ASM-R*),并通过实证研究和模拟研究评估新模型1P-ASM-R*的表现。结果显示:(1)相比于1P-ASM,1P-ASM-R*能更好地拟合实证数据;(2)在模型中引入学习效应不影响其捕捉问题解决任务的特征。总之,在问题解决能力过程数据测量模型中引入学习效应能够获得更加准确的问题解决能力估计值,为过程数据的分析提供新的、有价值的方法。
分类: 心理学 >> 社会心理学 分类: 心理学 >> 心理测量 分类: 心理学 >> 应用心理学 分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2025-03-11
摘要: 本研究以国家刻板印象为例,探索了一种基于大语言模型的心理指标评估方法,实现从概念识别直接到自动化测量的完整流程。研究一基于大语言模型提取自由描述文本中的国家刻板印象内容,并结合文本挖掘方法,再次通过大语言模型归纳出国家刻板印象的跨文化核心维度;研究二进一步基于大语言模型,构建了国家刻板印象自动化维度测量模型,并检验了模型的性能。结果显示:(1)大语言模型揭示了国家刻板印象的五个跨文化核心维度:文化丰富性、发达进步、强权威胁、社会平等、专制独裁;(2)基于大语言模型的自动化维度具有良好的效标效度和重测信度。本研究提出了大语言模型评估(LLM Rating)方法,为心理学评估提供了一种新的跨学科角度,展示了大语言模型在社会认知研究中的潜在应用价值。
分类: 心理学 >> 心理测量 提交时间: 2025-02-27
摘要: 题目自动生成(Automatic ItemGeneration,AIG)技术通过自动化生成测验题目,旨在(7南昌师范学院数学与信息科学学院,南昌360111)解决心理与教育测验中题目开发成本高、效率低、维护困难和安全风险等问题。但在提高效率的同时,如何保障题目质量仍是关键挑战。为此,梳理了AIG的理论基础,分析了从基于规则到数据驱动的技术演进历程,系统考察了不同类型测验中的应用实践,探讨了质量控制的多层次保障机制。提出了认知理论与深度学习融合、知识图谱与检索增强生成技术、提示工程优化、多模态技术融合和多层次质量评估等改进路径,以推动AIG从单一工具向成熟的智能测验系统转变,全面提升自动生成题目的质量与可靠性。
分类: 心理学 >> 心理测量 提交时间: 2025-02-05
摘要: 目的:修订社会疼痛问卷(Social Pain Questionnaire, SPQ),并在中国大学生群体中检验其信度和效度。方法:通过项目分析和探索性因素分析确定中文版SPQ题目,用验证性因素分析确定其结构,最后进行问卷的信效度检验。结果:中文版SPQ 10个条目具有良好的区分度,探索性和验证性因素分析结果(χ2/df=6.65,RMSEA=0.08,CFI=0.98,TLI=0.97,GFI=0.96,NFI=0.98)均支持单因子结构,量表的信效度符合测量学要求。结论:修订后中文版SPQ符合测量学标准,可作为测量我国大学生社会疼痛的可靠工具。
分类: 心理学 >> 心理测量 提交时间: 2025-01-14
摘要: 为进一步考察阻止自杀意念演变的保护因素,编制青少年生命保护因子问卷。基于前期访谈编制联结、理智和自杀否定三个分问卷,通过项目分析、探索性因素分析(N=1187)和探索性因素分析(N=1057)考察问卷维度构成,检验信效度。结果发现,青少年生命保护因子三个分问卷的内部一致性信度、分半信度、重测信度系数在0.71~0.97之间,结构效度、效标效度和区分效度良好,满足跨群体强等值。因此,青少年生命保护因子问卷可用于青少年自杀预防筛查。
分类: 心理学 >> 心理测量 提交时间: 2025-01-14
摘要: 国内外融合作答时间的测量模型研究多以0-1计分为基础。然而,在实际测验情境下(如数学测验中的多选题、计算题和应用题等),常采用等级计分方式。本文基于层次模型框架,在等级得分模型(GRM)上融入作答时间信息,构建联合作答时间的等级得分模型GRM-RT。参考已有实证研究,针对性地设置研究条件,重点考察在不同被试规模与测验长度条件下模型参数的估计返真性。并进一步将新模型应用于实证数据,一方面展示新模型的使用,另一方面进行不同模型的相对拟合比较。结果表明:在各实验条件下,GRM-RT模型的参数返真性较好且较为稳定;实证数据分析的结果进一步表明模型的实际应用价值。
分类: 心理学 >> 心理测量 分类: 心理学 >> 心理测量 分类: 心理学 >> 应用心理学 提交时间: 2024-10-09
摘要: 【目的】对Denise等人的情绪调节灵活性量表(Flexible Emotion Regulation Scale, FlexER)进行汉化和修订,并且探究情绪调节灵活性量表的结构与信效度,以及该量表在中国大学生中的试用情况。【方法】采用情绪调节灵活性量表和心理弹性量表对1010名大学本科生施测,并对情绪调节灵活性量表进行项目分析,效度分析和信度分析。【结果】9个条目的区分度良好,各条目与总分的相关在0.30-0.62之间。探索性因子分析得到了三个维度:可变性,惰性和多样性。验证性因子分析模型指数:χ2 =41.69(df =24),RMSEA=0.04,GFI =0.98,AGFI=0.96,NFI=0.94,CFI=0.98,IFI=0.98。各项指标都表明量表的模型达到了可接受的水平。FlexER量表总的α=0.72,各维度的α系数在0.66~0.68间。【结论】FlexER中文版在大学生群体中有着良好的信效度,适用于考察中国的大学生的情绪调节灵活性。
分类: 心理学 >> 心理测量 提交时间: 2024-09-16
摘要: Q矩阵的完备性是认知诊断模型具有可识别性的关键。多级评分含有比0-1评分更丰富的诊断信息,却鲜见多级评分完备Q矩阵的设计研究。用最少的题量获得最高判准率是测验设计者追求的目标,借鉴0-1评分完备Q矩阵的设计方法,本文提出从可达阵中获取多级评分结构化/非结构化最简完备Q矩阵(SSCQM/USCQM)的方法和算法。模拟实验得出以下结论:(1)测验含SSCQM/USCQM越多,判准率越高;(2)当列数相同时,含多个SSCQM或多个USCQM测验的判准率与含可达阵测验的判准率非常接近;(3)对于一些结构,纵使多个SSCQM/USCQM的列数少于可达阵列数,其判准率仍不低于可达阵。总之,短测验设计优先选择SSCQM;长测验设计优先选择USCQM。
分类: 心理学 >> 心理测量 提交时间: 2024-09-09
摘要: 离散选择模型法是基于随机效用最大化理论发展而来的一种研究范式, 它能预测个体和群体的各种偏好并探究偏好的影响因素。其设计流程包括开发属性和水平、确定选择集、设计调查问卷、进行预调查并收集数据, 它已广泛应用于测量心理健康管理、健康行为促进以及慢性病自我管理等健康心理学领域的偏好。未来健康心理学研究应重点开发和应用纵向离散选择模型法的设计, 以考察长期动态的健康决策行为。建议在心理学的教学和科研中强化对该方法的介绍与培训, 以促进这一方法的普遍应用并提升相关研究的质量。
分类: 心理学 >> 实验心理学 分类: 心理学 >> 心理测量 提交时间: 2024-08-24
摘要: 统计检验力是评估研究结果稳健性和可重复性的关键指标之一,然而在事件相关电位研究中计算和报告统计检验力的规范性和完整性仍有待加强。本文通过梳理总结事件相关电位研究中统计检验力的影响因素、方法以及应用实例等,能为研究者设计或预注册事件相关电位研究方案等阶段计算和报告统计检验力提供参考依据。
分类: 心理学 >> 心理测量 提交时间: 2024-08-08
摘要: 随着心理测量理论与方法的发展,个体差异具有的情境依赖性正得到广泛关注。为了实现全面、准确的个体差异测量,促进个人和社会的优化发展,近年来研究者日益重视在多种真实的日常情境下测量个体状态并构建个体差异计算模型,来达到相比传统实验室情境更加全面客观的个体差异测量。目前,以智能传感和穿戴式设备为代表的技术进步使得在日常生活中进行个体差异测量更加便捷高效,推动包括主观报告、行为表现、生理反应等方面的日常多情境个体差异研究取得新进展,形成了面向日常多情境高维数据的个体中心档案视角分析思想和方法。未来研究应关注日常多情境测量与档案视角分析方法的结合,以促进个体差异机制的深入理解,推动个体差异理论的深化与发展。
分类: 心理学 >> 心理测量 提交时间: 2024-07-24
摘要: 随着社会的发展和时代的变迁,生育决策中个体自我选择的成分增多,年轻人的生育观念受到了广泛的关注。作为生育观念的主要成分之一,生育动机,反映了个体生育或不生育的原因。对于育龄群体生育动机的准确测量有助于我们更好地理解并应对当前严峻的人口问题。然而,我国目前尚无成熟的用于评估生育动机的标准化量表。本研究在系统回顾国内外生育动机测量工具的基础上,综合运用定性和定量研究方法编制生育动机量表,并采用分层抽样的方法线上调查2000名育龄男女,以验证新编制量表的信效度。由于积极情感和消极情感的大脑通路不同,将积极和消极生育动机单独计分。因子分析发现积极生育动机和消极生育动机均存在两个维度(追求和渴望/习俗和规范;情感和社会/躯体和物质),量表的内部一致性、构想效度、校标效度和内容效度的检验结果提示量表符合心理测量学的标准,适用于测量我国育龄人群的生育动机水平。
分类: 心理学 >> 社会心理学 分类: 心理学 >> 心理测量 提交时间: 2024-07-22
摘要: 已有研究开发了大量的亲环境行为测量工具,涉及量表、个体行为范式和群体博弈范式,其中大多测量工具是基于行为领域设计,节约、出行、垃圾处理、消费和公域行为是五个最常被提及的领域。现有依据行为领域的亲环境行为测量方式存在标准化程度低及测量结果推广性受限的问题,这主要是由于缺少对行为属性这一行为决定性特征的关注。未来研究应基于行为属性选用和开发标准化测量工具,并选取多种真实行为作为效标进行效度检验。
分类: 心理学 >> 心理测量 提交时间: 2024-07-19
摘要: 测验安全的事后检测主要依靠统计量方法,而新兴的机器学习方法凭借良好的检测性能与统计量方法形成互补。为了推进测验安全问题的解决,综述了监督学习、无监督学习和半监督学习三大类机器学习方法及其衍生的集成学习、深度学习与迁移学习方法在测验安全领域的应用,阐述了不同机器学习方法的特点,提供了数据的获取及处理、输入特征的选择等实用的方法建议。未来研究可以从机器学习与个人拟合、机器学习与多模态数据、基于生成对抗网络的异常检测,以及增加研究结果的可解释性几方面开展。
分类: 心理学 >> 心理测量 提交时间: 2024-04-27
摘要: 迷思概念是指基于个人经验构建的对一些对象、事件或观点的错误理解。相比于识别问题解决技能的缺失,额外识别迷思概念有助于进一步明确学生出现错误的原因。关键行动编码是将传统心理测量模型迁移应用至分析行动序列等过程数据的必要手段。针对现有关键行动编码无法精细识别导致错误问题解决的原因的局限,本研究提出一种引入迷思概念的关键行动编码方式,以实现同时考虑问题解决技能和迷思概念对问题解决过程的影响。通过一则实证研究对比探究不引入和引入迷思概念的两种关键行动编码在过程数据诊断分类分析中的表现;结果主要发现引入迷思概念可实现对被试的更精细化分类,有助于进一步识别导致问题解决成败的具体原因。
分类: 心理学 >> 心理测量 提交时间: 2024-03-25
摘要: 目的:探索中国文化背景下个人特质与受PUA可能性之间的关系,编制适用于中国文化背景下易感PUA人群的个人特质量表及PUA关系的基本特征量表并检验其信效度。方法:结合文献检索、建构理论模型和问卷调查的方式形成初始问卷;易受PUA个人特质量表选取1188名成年人作为被试,PUA关系表现特征量表选取1188名经历过或正在经历亲密关系的成年人作为被试,分别对被试的问卷进行项目分析和探索性因素分析;两份问卷均进行验证性因素分析和信效度检验。结果:量表一易受PUA个人特质量表包含4个维度,共20个项目,因素结构模型的拟合指数良好,RMSEA=0.060, CFI=0.937, IFI=0.937, TLI=0.924, SRMR=0.042;量表二PUA关系的表现特征量表包含6个维度,共计29个项目。RMSEA=0.053, CFI=0.925, TLI=0.919, GFI=0.913, SRMR=0.059。量表一总量表与各维度的内部一致性信度在0.779-0.909之间,量表二总量表与各维度的内部一致性信度在0.897-0.970之间。结论:易受PUA个人特质量表及PUA关系表现特征量表的信度和效度良好,可以用作中国文化背景下个人特质与受PUA可能性研究时的测量工具之一。
分类: 心理学 >> 心理测量 分类: 心理学 >> 临床与咨询心理学 分类: 医学、药学 >> 临床医学 提交时间: 2024-03-12
摘要: Objective: This study aimed to develop and validate the Chinese Short Version of the Adult ADHD Self-Report Scale (ASRS-CSV), addressing the need for culturally appropriate diagnostic tools for Attention-Deficit Hyperactivity Disorder (ADHD) in the Chinese adult population.Methods: Utilizing a combination of intergroup difference analysis, factor analysis, and network analysis, we identified core ADHD symptoms pertinent to the Chinese cultural context. The study involved two samples: a vocational and technical school sample (N=1144) and an internet sample (N=1654), comprising adults aged 16-25 years. Reliability, validity, and diagnostic efficacy of the ASRS-CSV were assessed through psychometric testing.Results: The ASRS-CSV demonstrated high internal consistency (Cronbach’s alpha > 0.9) and robust convergent validity (AVE > 0.7). The scale’s diagnostic cutoff points were optimized, revealing high sensitivity and specificity for ADHD screening. Cross-cultural analysis highlighted differences in core ADHD symptoms between Chinese and Western populations, underscoring the scale’s cultural sensitivity.Conclusion: The ASRS-CSV is a reliable, valid, and efficient tool for screening ADHD in Chinese adults, reflecting the socio-cultural nuances of ADHD symptomatology. Its development marks a significant advancement in the field of psychiatry, offering a tailored approach for ADHD assessment in China and contributing to the global discourse on cross-cultural psychiatric diagnosis.
分类: 心理学 >> 心理测量 提交时间: 2024-02-01
摘要: 为得到一个质量良好的大型题库,进行传统形式项目开发所耗费的大量人力物力制约着目前计算机化自适应测验的发展与运用,而基于最新自然语言处理技术的自动项目生成有望解决这一难题。随着基于Transformer架构的生成式预训练模型的进步,根据特定测量目标(尤其是非认知任务),自动生成测验项目并以此为基础建立计算机自适应题库成为可能。本研究旨在利用最新版本的ChatGPT生成大量中文版测量情绪稳定性的人格项目,通过单维性检验、IRT模型选择、项目分析、题库质量分析等题库构建步骤以及模拟的计算机化自适应测验,探索这些项目对于计算机化自适应测验的适用性并与已被广泛使用的情绪稳定性项目进行性能对比,最终形成了一个质量良好的情绪稳定性题库。
分类: 心理学 >> 心理测量 分类: 心理学 >> 临床与咨询心理学 提交时间: 2024-01-14
摘要: 基于状态-特质焦虑理论和心理病理网络理论,编制大学生多维焦虑体验量表 (Multidimensional Anxiety Experience Scale for college students),并进行项目分析、因子分析、网络分析、信效度检验和性别不变性检验。结果表明:(1)大学生多维焦虑体验量表包含27个条目,分为社交焦虑、学习焦虑、家庭焦虑、未来焦虑、社会性别规范焦虑、外貌焦虑、经济焦虑7个维度。(2)本研究编制的大学生多维焦虑体验量表因子网络结构合理,信效度良好,具有性别不变性,可以有效测量中国大学生状态焦虑水平.