作者:侠之大者
愁呀~~~ 一直筹备一个大的研究报告,是关于测量
心理学的。其中涉及效度问题。不是有三种方法评估效度嘛?其中一种是为保持测试内部的一致性,这种方法叫split half. 我很清楚如何去应用、计算效度。但一直没搞懂把测试拆分两半求效度系数(reliability coefficient)的实际意义在哪儿?
比如说,我测试的两部分相关性很差,即效度系数低,有什么后果?这是我急待知道的。
谁了解IQ测试?我正在做IQ测试分析。比如说IQ测试中的两部分,假设
语言、逻辑运算的效度系数很低,为什么测试是不可依赖的??
问题2:在项目分析中,我们说总体分数应该随项目难度而递增,即测试分数越高的人答对的难题越多,是正比关系。但如果出现相反的情况,即converse discriminate,那么这个项目是不是同时影响信、效度?
引用:
ywjcrazy:
1、reliability是信度。。。。validity才是效度
分两半求信度系数(reliability coefficient)的实际意义是于没有复本时,而且不宜重测时,用分半求信度则犹如有两个平行测验(多一个复本),所以分开来的两份要尽可能地做到相等。
两部分相关性很差,则计算出来的分半信度低。分半的方法可以灵活采用,不一定要前后各半。当一个测验无法分成对等的两半时,分半信度不宜使用。
2、“但如果出现相反的情况,即converse discriminate”,这个不太理解。。。。
“总体分数应该随项目难度而递增”:“难度”(P值)越大,题目越简单,所以总分越高,恐怕你误解了。某个项目的区分度会影响信度,而难度常常影响区分度。。。。
唉,郁闷,中
英文意思又搞反了。reliability是信度。。。。validity才是效度。这回记住了,谢谢。
但还是不大明白,关于分半信度的操作我知道。我还是不大理解两半相关性高意义何在,也就是它的价值?是不是主要联系到效度问题?
举个例子:在IQ测试中,逻辑分析与语言测试相关性低,可能是因为大多测试者擅长某一部分。
能给我举个例子,比如内部相关性差(即分半求信度,信度很低)的后果是什么? 这是我想要的东西。
关于第二个问题,我不大理解你说的"难度”(P值)越大,题目越简单,所以总分越高"
怎么难度大题目反而题目越简单?
我主帖想要说的是:总分高的人他答对的难题也越多。而不是难的题反而让分数低的人答对,高分的人倒错了(这种情况就是我说的converse discriminate)。你说的区分度可能是不是就是这个?discriminality?
总之,项目分析直接影响到信度问题,是吧。
引用:
ywjcrazy:
分开来的两份要尽可能地做到相等。
分测验的相关一般来说就应该低的
内部相关性差与分半信度低不同。内部一致性高,说明测验的项目是针对同一个特质;那么低的话就。。。。
分半信度低的话,可能是你分成的两份不相等(分得不好),或者原来的量表信度就不高
难度(difficulty)的定义是指通过率,0.1意味着有十分之一的人通过
discriminality 看来指区分度了,区分度影响信度与效度的。converse discriminate应该指区分度为负值,题目无效度
我再总结一下我的问题:内部相关性差(即分半信度系数低,alpha coefficient低),它对于测试本身的影响是什么?也就是说内部信度低,会造成什么直接影响,是怎么影响测试分数的准确性?!
我很郁闷,看了不下5、6本书,都是讲如何计算分半信度,竟没有讲内部信度低为什么影响测试结果?
引用:
ywjcrazy:
恐怕你搞混了。 分半信度(split-half)与内部一致性信度(homogeneity)是不一样的
分半信度一般用Spearman公式,而内部一致性信度一般用alpha coefficient.
内部一致性高,说明测验的项目是针对同一个特质;反之,题目不是针对某一个特质
分半信度低的话,可能是你分成的两份不相等(分得不好),或者原来的量表信度就不高
当然,你也可以把所有的可能分半算出来,理论上可以作为内部一致性信度。
首先,谢谢你的解答。看来我们学的可能略有所不同。我们书上讲的,分半信度方法(split-half method)是解决内部一致性信度之一,他们是一码事,分半方法包含在内部一致性之中(Internal consistency)。
至于 spearman coefficient, alpha coefficient,还有KR20, KR21解决的都是内部一致性问题。
而KR20,alpha coefficient解决的也是分半问题,这些公式已经把所有分半的可能性考虑进去,因而不存在分得不好的问题。即Spearman, KR20, alpha解决的都是内部一致性问题。
你说的特质是不是一个效度问题?看来一致性低进而影响了效度问题?! 谢谢!
引用:
ywjcrazy:
呵呵,看来我们看的书对信度的分类有些不同。
从广义上讲,分半信度方法(split-half method)是解决内部一致性信度之一。
正如我上面最后所说的,你也可以把所有的可能分半算出来,理论上可以作为内部一致性信度。
你看有KR20, KR21系数的推导,它们是对各个项目进行的总和。
如果仅仅考虑一次分半,那也太粗糙了。所以从这个角度来说,分半信度与“所有题目”一致性信度是不同的
Quote:引用第11楼侠之大者于2007-09-29 14:54发表的 :
嗯,你说的对。你上帖指的“同一特质”是不是效度??
我是指测量同一个东西。比如某IQ测验,如果内部一致性信度高的话,说明里面的项目都是测量同一个东西;如果低的话,说明不是测量同一个东西。如果把语言和操作混合起来计算内部一致性信度的话,内部一致性信度应该是低的,因为两者测的内容是不同的。
效度就是指所谓的IQ测量的的确是一个人的智商非不是其它东西
对,信度高不代表效度高。但效度高信度就高。
我可能没说清,内部一致性信度低(即测量了不同的东西),进而直接影响了效度?