分类: 心理学 >> 心理测量 分类: 心理学 >> 心理统计 提交时间: 2023-11-28 合作期刊: 《心理科学进展》
摘要:随着密集追踪研究在心理学等社会科学领域的广泛运用,密集追踪情境中测验信度的估计也受到越来越多研究者的关注。早期沿用横断研究中信度估计思想或基于概化理论的信度估计方法存在诸多局限,并不适用于密集追踪的情境。针对密集追踪数据的多层结构和动态特性这两大特点,可基于多层验证性因子分析、动态因子分析和动态结构方程模型估计密集追踪研究中测验的信度。通过实证数据的演示与比较,讨论三种估计方法的特点和适用情境。未来研究可基于其它密集追踪模型探讨测验信度的估计,也应重视测验信度的检验与报告。
分类: 心理学 >> 心理测量 提交时间: 2023-11-22
摘要:G-DINA (the generalized deterministic input, noisy and gate)模型限制条件少,应用范围广,满足大量心理与教育评估测验数据的要求。研究提出一种适用于G-DINA等模型的同时标定新题Q矩阵与项目参数的认知诊断计算机化自适应测验(CD-CAT)在线标定新方法SCADOCM,以期促进CD-CAT在实践中的推广与应用。本研究分别基于模拟题库以及真实题库进行研究,结果表明:相比传统的SIE方法,SCADOCM在各实验条件下均具有较为理想的标定精度与标定效率,应用前景较好;SIE方法不适用于饱和的G-DINA等模型,其各实验条件下的Q矩阵标定精度均较低。
分类: 心理学 >> 心理测量 提交时间: 2023-11-13 合作期刊: 《心理学报》
摘要:作答选择题可被看作从噪音中提取信号的过程,研究提出了一种基于信号检测论的认知诊断模型(SDT-CDM)。新模型的优势在于:(1)无需对选项进行属性层面的编码。(2)能获得传统诊断模型无法提供的题目区分度和难度参数。(3)可以直接表达每个选项之间的合理性差异,对题目性能刻画更加细微全面。两个模拟研究结果表明:(1)EM算法可以实现对新模型的参数估计过程,便捷有效。(2)SDT-CDM具备良好性能,分类准确性和参数估计精度较高以外,还能提供选项层面的估计信息,用于题目质量诊断与修订。(3)属性数量、题目质量与样本量等因素会影响SDT-CDM的表现。(4)与称名诊断模型NRDM相比,SDT-CDM在所有实验条件下对被试的分类准确性更高。实证研究表明:SDT-CDM比NRDM具有更好的模型数据拟合结果,其分类准确性和一致性更高,尤其当属性考察次数较少时具有很强的稳定性,难度和区分度参数与IRT模型估计结果的相关性也更高,值得推广。
分类: 心理学 >> 实验心理学 分类: 心理学 >> 实验心理学 分类: 心理学 >> 心理测量 提交时间: 2023-09-30
摘要:研究结果的稳健性和可重复性对于科学研究的发展至关重要,但在脑电研究文献却极少见到完整的统计检验力报告。本文主要是通过对已有研究的梳理总结,从而介绍脑电研究中统计检验力分析方法、应用实例以及实验设计、效应幅值、样本量以及试次数量等影响因素,以期为研究者设计和/或预注册研究方案等阶段计算和报告事件相关电位研究中的统计检验力提供参考。
分类: 心理学 >> 应用心理学 分类: 心理学 >> 心理测量 提交时间: 2023-05-27
摘要:检验移动阿格纽关系问卷中文版(mARM-C) 的信、效度。采用mARM-C及效标问卷测量574名近期使用过冥想APP的大学生,两周后抽取102名重测。通过探索性因子分析及网络分析发现,该问卷包括5因子共19个条目;验证性因子分析也表明模型拟合良好,且效标关联效度、聚敛效度、区分效度良及内部一致性信度均达到心理测量学标准。因此,mARM-C信效度良好,可用来测量在线自助干预中用户与程序间的数字治疗联盟。
分类: 心理学 >> 心理测量 分类: 心理学 >> 心理统计 提交时间: 2023-05-11
摘要:心理学研究中,不恰当的模型参数估计框架或收敛准则严重影响模型参数点估计的可靠性,进而影响到研究结论的可靠性。本研究提出了基于MLE-EM的CDM模型参数估计新框架,以及新收敛判断方法。通过模拟研究与实证数据分析的方式,探索了新参数估计框架和新收敛判断方法的表现,并与已有模型参数估计框架及收敛判断方法进行了比较。结果显示,新的模型参数估计框架及收敛准则的表现优于已有的模型参数估计框架及收敛准则,能有效提高模型参数点估计的可靠性。
分类: 心理学 >> 社会心理学 分类: 心理学 >> 心理测量 提交时间: 2023-05-04
摘要:学业内卷虽有可能危害高校人才培养,但尚缺乏可靠的测量工具进行检验。本文通过3 个研究开发了大学生学业内卷问卷并验证其有效性。研究 1 结合文献分析、生活观察和访谈构建了初始题库,并基于 338 名大学生的试测结果筛选了题目。研究 2 基于大样本(N = 3000)的探索性因子分析和独立样本(N = 571)的验证性因子分析确立了 16 个条目,三因子(舍心逐物、竞争失格和脱实务虚)的最终版问卷。 3000 人的样本显示, 多数学生表现出较高的学业内卷。 高学业内卷个体的零和信念更强、特质焦虑更高、生活满意度更低、睡眠质量更差,但创造力倾向却没有更高。研究 3 基于 99 人的数据发现问卷重测信度为 0.83。本研究不仅开发了可靠的测量工具,还发现大学生学业内卷普遍存在且危害明显。
分类: 心理学 >> 心理测量 提交时间: 2023-04-22
摘要:测验模式效应(Test Mode Effect, TME)是指同一测验采用不同测验形式施测而产生的测验功能差异。TME的存在会对测验公平、选拔标准和测验等值等产生影响,因此对TME进行准确检测和合理解释具有重要意义。通过对TME的来源、检测(包括实验设计和检测方法)以及研究结果进行系统梳理,全面展示TME研究的方法论。对TME模型进行进一步解释、对TME研究中的测验形式进行拓展以及将TME的研究成果应用于我国的大规模教育测评项目,都是TME领域的未来重要发展方向。
分类: 心理学 >> 认知心理学 分类: 心理学 >> 实验心理学 分类: 心理学 >> 心理测量 分类: 心理学 >> 心理统计 分类: 心理学 >> 心理学其他学科 分类: 语言学及应用语言学 >> 语言学及应用语言学 分类: 其他 >> 综合 提交时间: 2023-02-08
摘要:【目的】本研究旨在建立与新冠疫情相关的多维度、标准化的词语库,从而为与新冠疫情有关的心理学或神经科学等相关领域的研究提供实验材料。【方法】本词语库参考国内外情绪词语库的建立方法并采用点探测任务以及词语库中的词语作为实验材料来检验疑似具有新冠恐惧被试的注意偏向,从而检验词语库的有效性。【结果】我们通过筛选和处理,最终将196个新冠词和99个中性词纳入了词语库,然后对词语通过6个维度进一步进行分类和评估、建立了一个标准化的中国新冠词语库,词语具有较好的信度和内部一致性。除此之外,通过点探测任务检验其效用,验证新冠高相关度的词语与具有新冠恐惧被试之间的关系,词语库可靠性较高,其中材料可作为与新冠相关的情绪和情感研究。【局限】初步样本量较少以及词语库应用面需要进一步开发。【结论】我们初步建立的中国新冠词语库具有较好的信度、内部一致性和可靠性较高,可以作为未来与新冠疫情研究相关的材料。
分类: 心理学 >> 社会心理学 分类: 心理学 >> 认知心理学 分类: 心理学 >> 心理测量 分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2023-01-30
摘要:词嵌入是自然语言处理的一项基础技术。其核心理念是根据大规模语料中词语和上下文的联系,使用神经网络等机器学习算法自动提取有限维度的语义特征,将每个词表示为一个低维稠密的数值向量(词向量),以用于后续分析。心理学研究中,词向量及其衍生的各种语义联系指标可用于探究人类的语义加工、认知判断、发散思维、社会偏见与刻板印象、社会与文化心理变迁等各类问题。未来,基于词嵌入技术的心理学研究需要区分心理的内隐和外显成分,深化拓展动态词向量和大型预训练语言模型(如GPT、BERT)的应用,并在时间和空间维度建立细粒度词向量数据库,更多开展基于词嵌入的社会变迁和跨文化研究。
分类: 心理学 >> 心理测量 提交时间: 2023-01-05
摘要:行动序列作为一种典型的过程数据,可反映被试解决问题的详细步骤。鉴于行动序列可区分正误,本文基于二分类Logistic建模提出两个复杂度相对较低的行动序列模型——单/两参数行动序列模型(1P-/2P-ASM);两者差异在于是否允许自由估计问题状态的区分度。通过实证研究和模拟研究对比探究两个新模型与基于多分类Logistic建模的序列作答模型(SRM)的表现。研究结果主要发现(1)两个ASM能够获得与SRM几乎一致的问题解决能力估计值;(2)两个ASM的计算耗时明显低于SRM的;(3) 2P-ASM比1P-ASM的综合表现更优。总之,两个模型复杂度相对低的ASM均能够实现对行动序列的有效分析,有益于行动序列数据分析的落地。
分类: 心理学 >> 心理测量 分类: 心理学 >> 应用心理学 分类: 医学、药学 >> 预防医学与公共卫生学 提交时间: 2022-12-06
摘要:目的 简化健康素养量表并在中国人群中进行心理测量学检验。 方法 纳入居民7449人进行量表的测评,并将数据随机生成2个数据集,分别进行描述性分析、验证性因子分析,应用经典测量理论(CTT)以及项目反应理论(IRT)中的Mokken模型进行条目筛选,并对精简后的量表进行信效度等的验证性分析。 结果 使用经典测量理论和Mokken模型分别简化出一个9条目版本的量表(HLS-SF9)和一个4条目版本的量表(HLS-SF4)。简化后的健康素养量表HLS-SF9与HLS-SF4均无天花板效应、地板效应,二者的Cronbach’s α 系数为0.913和0.842,HLS-SF4经探索性因素分析(EFA)检验出一个公因子,HLS-SF9经验证性因素分析(CFA)结果显示其三维模型的各适配指标均优秀,以领悟社会支持量表与家庭健康量表为校标量表,HLS-SF9与HLS-SF4均有显著的正相关(r=0.367, p<0.001;r=0.292, p<0.001)(r=0.340, p<0.001;r=0.266, p<0.001),表明实证效度良好。同时HLS-SF9、HLS-SF4与原量表所测量的内容有高度一致性。 结论 简化后的健康素养量表具有良好的信效度,是快速测评中国人群健康素养的可靠且有效工具。
分类: 心理学 >> 发展心理学 分类: 心理学 >> 心理测量 提交时间: 2022-11-20
摘要:自然语言处理的发展为探究语义距离与创造性思维的关系提供了可靠且有效的研究方法。近些年关于两者之间关系的研究逐渐增多,但研究结论并不一致。本研究基于创造力联想理论及扩散激活模型,通过元分析的方法探讨了语义距离与创造性思维的整体关系,并且分析了以往研究结论不一致的原因。本文经过文献检索和筛选后获得14项研究,提取r值作为效应值 (共53个效应值,4729个独立样本),并使用随机效应模型进行了元分析。结果显示:语义距离与创造性思维存在中等程度的正相关 (r = 0.379, 95%CI [0.300, 0.452]);二者的相关强度受到被试年龄和创造性思维不同测量指标的调节。研究结果表明语义距离与创造性思维关系密切,同时解释了以往研究结论不一致的原因。上述结果不仅能为更深入地探讨创造性思维的认知神经机制提供新的研究视角和理论解释,而且有助于更全面地理解语义距离与创造性思维二者的关系及其边界条件,为更好地解释、预测和提升创造力提供科学依据和重要启示。
分类: 心理学 >> 心理测量 提交时间: 2022-10-06
摘要:研究通过在纵向诊断数据分析中引入计算简单、耗时少的汉明距离判别法(HDD),提出了纵向HDD (Long-HDD)。与HDD相比,Long-HDD额外使用汉明距离刻画个体在相邻时间点上对属性掌握的相依性,以利用前一时间点信息提高当前时间点的分类准确性。三个模拟研究的结果主要表明:在分析纵向诊断数据时,与参数化模型相比,Long-HDD的分类准确性几乎不受样本量影响,在样本量较小时表现更优;且其计算耗时更少,更有利于提供及时性诊断反馈。实证研究结果表明Long-HDD可用于分析实践测评数据,且其追踪诊断结果与参数化模型的存在一致性。
分类: 心理学 >> 心理测量 分类: 心理学 >> 心理统计 分类: 心理学 >> 心理学其他学科 提交时间: 2022-09-19
摘要:人类已经进入人工智能时代,开展日益复杂的心理学研究亟需创新性的数据收集和处理手段,人工智能及相关技术能够进行生态化、动态、多元、精准的数据收集,并能够处理海量、多模态的数据,可以弥补传统心理学研究手段的不足。因此,与人工智能的结合是未来心理学发展的一大方向。同时,在心理学的智能化进程中也不能过度依靠数据驱动的研究方法。融合自上而下的理论驱动和自下而上的数据驱动手段在智能化心理学研究中也是至关重要的。
分类: 心理学 >> 心理测量 分类: 心理学 >> 临床与咨询心理学 提交时间: 2022-08-24
摘要:目的:编制大学生多维状态焦虑量表,并检验其信效度。方法:对165名大学生进行开放式调查,形成预测量表;对286名大学生预测量表的数据进行项目分析、探索性因素分析以及网络分析,对245名大学生预测量表的数据进行验证性因素分析和信效度检验,对699名大学生预测量表的数据进行性别不变性检验,并确定正式量表。结果:大学生多维状态焦虑量表共27个条目,包括社交焦虑、学习焦虑、家庭焦虑、未来焦虑、社会性别规范焦虑、外貌焦虑、经济焦虑七个因子。在条目网络中,EA3、AA3、GNA1、FA3、FRA4、LA1、SCA5具有较高的中心性。在因子网络中,社交焦虑具有最高的中心性(closeness =1.388)。总量表Cronbach α系数为0.948,各维度的Cronbach α系数为0.792-0.879;量表的结构效度(χ²/df=2.706;GFI=0.918;RMSEA=0.049;CFI=0.951;NFI=0.924;NNFI=0.943;TLI=0.943;IFI=0.951)、区分效度(HTMT < 0.85)和校标效度(r > 0.6,p < 0.001)良好,具有较稳定的性别不变性。结论:该量表各项指标均达到心理测量学要求,可以有效测量当下中国大学生的状态焦虑水平。
分类: 心理学 >> 临床与咨询心理学 分类: 心理学 >> 心理测量 提交时间: 2022-07-28
摘要:物质成瘾是一种涉及生理、心理和环境等多因素的复杂现象, 但是当前基于生物还原论的解释对物质成瘾现象整体性的理解和康复研究造成了阻碍。网络理论聚焦于心理障碍变量之间相互作用形成的反馈环路, 从整体视角为研究物质成瘾提供了新的理论框架。将网络理论应用于物质成瘾的研究中将有利于:(1)理解症状之间的相互关系和影响; (2)理解症状网络的整体性和系统性动态变化过程; 以及(3)将多层次和多水平因素整合到统一的理论框架中。从网络理论视角来理解物质成瘾, 也将对未来的干预和治疗提供了理论支持。目前, 网络理论仍处于言语模型阶段, 未来需要进一步提出更具体、可验证的统计模型, 以完善对于物质成瘾机制的了解, 更加有效地推进物质成瘾的治疗与恢复。
分类: 心理学 >> 心理统计 分类: 心理学 >> 心理测量 提交时间: 2022-07-15
摘要:Q矩阵是CDM的核心元素之一,反映了测验的内部结构和内容设计,通常由领域专家根据经验进行主观界定,因此需要对可能存在的错误进行修正。本研究提出了一种新的Q矩阵修正方法——基于完整经验交叉相乘信息矩阵的Wald-XPD方法。采用Monte Carlo模拟检验了新方法的表现,并与同类方法进行了比较。研究表明:新开发的Wald-XPD方法在Q矩阵恢复率、保留正确标定属性的比例以及修正错误标定属性的比例这三个主要指标上均有较好的表现,且整体上优于其他方法,尤其是在修正错误标定的属性方面。通过实证数据展示了Wald-XPD方法在Q矩阵修正中的良好表现。总之,本研究为Q矩阵修正提供了有效的方法。
分类: 心理学 >> 心理测量 提交时间: 2022-05-26
摘要:多级属性是将诊断测验中传统的二值(即两种水平,通常定义为0和1)属性定义为多值 (多个水平可以为0,1,…),它不但可以描述学生对于知识属性是否掌握,而且可以描述学生在属性上的掌握程度,这样使得诊断测验能提供给被试更丰富的知识掌握详情。本文将适用于二级属性Q矩阵的统计量 (S 统计量)拓展到多级属性下的Q矩阵验证和估计,在两种常见的条件下,设计了两种估计算法:联合估计算法和在线估计算法。模拟实验结果表明:联合估计算法适用于对专家界定的初始Q矩阵进行验证,当初始Q矩阵中包含较少的错误时,通过联合估计算法有很大可能恢复正确的Q矩阵;在线估计算法适用于对“新项目”进行属性向量和项目参数的在线标定,基于一定数量的“基础项目”,在线估计算法对于新项目的估计也能达到较满意的成功率。实证数据分析则进一步展示了该方法的使用。
分类: 心理学 >> 心理测量 提交时间: 2022-05-14
摘要:相对于传统的离散作答数据,作答时间作为连续数据,可以提供更多信息。改变点分析(change point analysis)技术在心理和教育领域是一个比较新的技术。本文一方面对改变点分析在心理测量领域的应用进行了一个综合的总结和分析;另一方面,将基于作答数据的两种改变点分析统计量推广到作答时间数据,将改变点分析技术应用到测验异常作答模式:加速作答speededness的检测上。采用两种检验方法:似然比检验和Wald检验,分别在已知和未知项目参数的条件下,实现异常作答模式的检测。结果表明,所采用的方法对于加速作答行为的检测具有很高的检验力,同时能够很好的控制I类错误率。实证数据分析进一步表明本文中所使用的方法具有应用价值。