为一个企业提供价值,行为测评必须准确。
准确性归结于两个因素:信度和效度。换句话说,一个好的量测标准必须测量出它应该要测量的项目,而且必须始终如一的持续达成。
信度和效度不仅仅是抽象的概念,统计的方法可以评估出它们的达成度。但大多数性格测试和行为评测工具都不会费劲去做信度和效度的等级评估,这就是PDP和其他测评工具最大的不同之处。
PDP 的ProScan问卷开发于1976年,使用一套严格的方法来确保它是可靠和有效的。从那时起,我们定期验证,ProScan问卷测评继续表现良好,为我们的客户提供真正的价值。
这就是为什么你可以相信,PDP行为测评会忠实呈现其研究结果,并对你的公司产生真正的影响。
在心理测试中,信度具有特定的技术含义:它是指一个工具如何能够可靠且有一致性的测量个性特质。
例如,想象一下,你踩上体重计,它显示了你的重量。然后一分钟后你又踩了上去,该体重计显示你比之前重了25磅。该体重计不可信,因为它没能提供一致性的测量结果。这会是一个问题,因为这意味着你不能相信这体重计提供的结果。
行为测评是一样的,有些工具比其他的工具更可靠。
我们通常使用两个统计数据来衡量信度:克隆巴赫α系数和测试—再测信度的关联性系数。
克隆巴赫α测量内部的一致性—一组项目在一群体中有多大的关联性。即例如,你可以查看测量“支配性”特质中的每一个测试项目,同时查看它们与所有测量“支配性”特质的其他项目之间是否有密切的关联性。
克隆巴赫α的计算为介于0和1之间的数值,其中0代表所有测量同一特质的项目彼此完全没有关联性,1代表所有测量同一特质的项目彼此关联性非常高。测试专家认为,克隆巴赫α数值高于 0.70 代表具有足够的信度。
在最初的研究中,PDP Global的ProScan问卷获得了克隆巴赫α=.94的出色信度得分。从此之后,在每一次研究结果中也都一致性获得高分的克隆巴赫α 系数。
测试—再测信度是测量信度的一种指标,着眼于一位应试者在不同时间段内进行测评的结果是否具有一致性。它的计算方法是,将你的测评结果与几个月后进行的同一测评结果进行关联性比对。
如同克隆巴赫α一样,测试—再测信度的计算也是介于0和1之间的数值,其中0代表测试—再测的信度非常差,而1代表应试者再次进行测试的结果与前次测试的结果完全一致。测试专家通常建议,测试—再测的信度系数高于 0.70 可以被认定是好的。
在研究中,PDP Global的ProScan问卷的测试—再测信度系数是介于0.76到0.86的高分。
准确性的另一个面向是效度—测评工具是否测量了它所要测量的项目?
效度有几个不同的种类和测量方法。测量效度的方法之一是,进行验证性因素分析(CFA)测试。验证性因素分析查看的是测试的结构,同时检视测量个性特质的数据是否与原来预计应该要测量的一致。要获得一个验证性因素分析的结果需要进行大量的研究,这就是为什么与探索性因素分析(EFA)比较起来,验证性因素分析持续成为统计测试的黄金标准。
对于ProScan问卷工具,我们需要检视问卷参与者的回答与测评的四项行为特质因素(支配性、表达性、耐心性、精确性)和单一因素(逻辑)结构是否达成一致。最新一组验证性因素分析发现,当前的测评结构与研究收集到的数据具有极好的拟合度。我们在2021年完成的多年期研究,引导我们进行三个验证性因素分析,再加上2019年进行的11项探索性因素分析(其中有7项在每次进行研究时都有超过3,000名问卷参与者参加),总共有超过39,000人参与了我们包含11项探索性因素分析和3项验证性因素分析的研究,这证明了我们对扎实研究的奉献精神。
另外一种重要的效度是同时效度。同时效度着眼于一个测评与其他类似测评的关联性。PDP Global 在同时效度上持续展示出强而有力的证据,在与其他类似测评的关联性系数达到 0.39 到 0.87 之间的高分。
最后,确保PDP Global的测评工具能够有效的运作是非常重要。预测效度证实了ProScan测评工具可以预测未来的行为,在这种情况下,可以预测未来工作的成功。同样,第三方的研究发现,ProScan确实成功地预测了未来的工作表现和绩效。在一项研究中,测评中的行为特质成为三个工作场所KPI 的有效预测指标。
PDP Global 精心打造了我们的测评工具,以确保它不会产生差异化的影响。
当一个申请人群体的成员因为测评结果而比另一个群体享有更好的就业机会时,就会产生差异化的影响。第三方机构科罗拉多大学丹佛分校应用心理学中心的研究,对PDP ProScan彻底进行了全面性的审查,评估ProScan问卷在性别、种族和年龄上是否存在差异化影响。
结果很明显,差异化影响影响完全不存在,也就是说,ProScan问卷公平对待所有群体的所有人,没有差别待遇。
我们所有的测评工具都符合平等就业机会委员会(EEOC)的规定,并遵循就业测试和选拔程序的政策。有一些劳动和就业律师称赞PDP认真对待在问卷设计上符合各州和联邦歧视法的法律诚信,你可以放心,在使用我们的行为评测工具时,你绝对完全遵守所有相关的雇佣法律和政策。
确保行为测评工具的准确不是一劳永逸的一次性活动,测评工具需要不断的进行测试和改进。
自 1970年代的第一次验证研究以来,我们持续不断的在验证我们的问卷工具。在我们的11项探索性因素分析中,除了当时已经使用的30个单词外,我们还测试了其他50个行为特质形容词。我们之所以坚持这个过程,是因为我们的首要任务是确定这30个单词是最佳组合,能够具备最强大的统计效力,特别是因为语言会随着时间的推移而演变。接着,验证性因素分析证明了我们的优化问卷工具是一个适合在现实世界中进行实际应用的准确模型。该研究的因素分析发现,克隆巴赫α系数得分为 0.84,远高于被认定可接受的 0.70 标准。
我们不断审查我们的问卷工具,以确保它们持续为我们的客户提供最好的服务,其严格的测试程序远远超过其他公司。
在工作场所之外,有人可以参加简单的性格测试,以获得轻松愉快的娱乐。但对于企业来说,情况就不同了。公司需要确保他们的员工行为测评能够有效,让公司的投资获得回报。
PDP Global的团队进行了无与伦比的研究,使我们的行为测评套件成为市场上最准确的工具。PDP Global遵循美国心理学会和工业与组织心理学协会中概述的测评构建方法。在招聘方面,我们的工具符合美国平等就业机会委员会和《美国残疾人法案》制定的要求和标准。
PDP Global的行为测评套件可以帮助你聘用合适的人员、减少员工流动、提高工作满意度,以及其他更多的事项。
了解我们如何帮助你做出更好的人员决策。尝试一个展示。