Title | Ejercicios PsicometrÍa |
---|---|
Course | Psicometría |
Institution | Universidad de Deusto |
Pages | 26 |
File Size | 1 MB |
File Type | |
Total Downloads | 58 |
Total Views | 119 |
Ejercicios de la asignatura de PsicometrÍa (3º de Psicología)....
PRÁCTICA 3. EN CLASE: CALCULAR ALPHA DE CRONBACH
Se les ha aplicado a 4 participantes este de test de 4 items. En la siguiente tabla se presentan las respuestas de los participantes, calcula el alpha de cronbach.
1
2
3
4
1
1
1
1
2
2
5
4
5
1
3
3
3
4
2
4
5
5
5
1
4/4-1(1- 2’75+2’19+2’69+0’25) = 0’75 18’5
PRÁCTICA 3. EN CLASE: KR20 y KR21
Se les ha aplicado a 6 adolescentes un examen modelo test. El 1 significa que el ítem lo ha contestado bien, y el 0 que lo ha contestado mal. Calcula el KR20 y el KR21.
1 2 3 4 5 6
1 1 1 1 0 0 1
p-q
0’22
2 1 1 0 1 0 0
3 1 1 1 0 0 0
0’25
0’25
4 1 0 0 1 0 0 0’22
5 1 1 1 0 0 0
6 1 1 1 1 0 0
0’25
0’22
X 6 5 4 3 0 1
KR21= 6/6-1 [1- 3’16 - (3’162/6) = 1’2 (1- 1’5 ) 4’52 4’52 = 1’2x0’67 0’80
Ox2= (62+52 +42+ 32+12 /6) - 3’162 = 4’52
KR20= 6/6-1 [1- (0’22+0’25+0’25+0’22+0’25+0’22)] 4’52 = 1’2 (1-0’31)= 1’2 x 0’69 0’828
Ox2= (62+52 +42+ 32+12 /6) - 3’162 = 4’52
FIABILIDAD INTERJUECES: COEFICIENTE KAPPA A continuación te aparecen las respuestas de 12 niños y niñas contestando a cómo actuarían ante el comportamiento de un/a compañero/a. “Has ido a sacar punta al lapicero. Al regresar a tu sitio un compañero/a tuyo/a tiene la pierna en el pasillo, te tropiezas y te caes al suelo. ¿que harías?” 1. Teniendo en cuenta la siguiente clasificación codifica las respuestas: 1) Comportamiento agresivo 2) Comportamiento asertivo 3) Comportamiento de evitación NIÑO/A RESPUESTA
CÓDIGO
1
Le diría que se lo voy a decir a la profesor/a
2
2
Le pegaría una patada
1
3
Le diría que pusiese la pierna debajo de la mesa para que nadie se vuelva a caer
3
4
Volvería a mi sitio
3
5
Decirle a la profesora lo que ha pasado
2
6
Le llamaría “tonto/a” y le diría que eso no se hace
1
7
Le haría lo mismo en el recreo
1
8
Le diría que no pusiese la pierna ahí, porque se podría caer otro amigo/a
3
9
Me enfadaría
2
10
Le diría que me pidiese perdón
2
11
Le daría un tortazo
1
12
Me levantaría lo más rápido posible para que el resto no se ría
3
2. Ahora compara tus respuestas/puntuaciones con tu compañero/a y calcula la kappa
1
2
3
4
5
6
7
8
9
10
11
12
Obs 1 2
1
2
3
2
1
1
2
2
2
1
3
Obs 2 2
1
3
3
2
1
1
3
2
2
1
3
Observador 2 Cond 1
Obs 1
Cond 2
Cond 3
Conducta 1
4
0
0
4/12
Conducta 2
0
4
2
6/12
Conducta 3
0
0
2
2/12
4/12
4/12
4/12
Po= 10/12 x100= 83’33% -> 0’83 k= po-pe/1-pe= 0’83-0’34/1-0’34 =0’49/0’66 = 0’74 -
Es un buen valor de kappa (bueno: 0’60-0’75)
Pe =( )x (124 )+ (6/12x4/12) + (2/12 x 4/12)= 12 4
0’11+0’17+0’06 = 0’34
PRÁCTICA 5: Analizar la fiabilidad para un Test de ansiedad social con SPSS Vamos a analizar la fiabilidad de la puntuación total y de las subescalas: Alpha de Cronbach o Analizar → Escalas → Análisis de Fiabilidad Formas paralelas o Analizar → Correlaciones → Bivariadas Dos mitades o Analizar → Escalas → Análisis de fiabilidad (Modelo: Dos mitades) → estadísticos (correlaciones) Test-retrest o Analizar → Correlaciones → Bivariadas Kappa o Analizar → estadísticos descriptivos → tablas cruzadas
Pasos a seguir: ✓ Probar que las puntuaciones van en la misma dirección y si fuese necesario recodificar: o
Transformar → Recodificar en distintas variables (Valores antiguos y nuevos)
✓ Calcular la puntuación total y calcular las subescalas (3). Transformar → Calcular variable ✓ Calcular el alpha de la puntuación total y de las subescalas (en los dos tiempos) ✓ Calcular la correlación entre las formas paralelas.
✓ Calcular el coeficiente de fiabilidad mediante el método de dos mitades. ✓ Calcular el test-restest de la puntuación total y de las subescalas. ✓ Calcular la fiabilidad interjueces (coeficiente Kappa) En la base tenemos: Sexo, Edad, Estudios, Estado civil 17 items de Ansiedad social (AS_1, AS_2, etc.) Puntuación total de Fobia Social (FS). Lo utilizaremos para calcular la forma paralela 17 items de ansiedad social 2 meses más tarde (T2_AS1, T2_AS2, etc.) EVA1 evaluador 1 y EVA2 evaluador 2 3 subescalas: 1. Items: 1, 3, 6,10, 12, 15, 17 2. Items: 2, 4, 8, 11, 16 3. Items: 5, 7, 9, 13, 14
Alpha de
Test Retest
Cronbach
Dos
Formas
mitades
paralelas
0'83
0'58
Puntuación total T1 0'89
0'68
0’90
0’57
0'90
0’33
0'93
0’53
Subescala 1 T1
Subescala 2 T1
Subescala 3 T1
Puntuación total T2 0'83 Subescala 1 T2 0'62 Subescala 2 T2 0'61 Subescala 3 T2 0'58
Coeficiente Kappa: → la medida de consistencia es de 0’84 ¿Podemos calcular KR20 y KR21? ¿por qué? No, porque los ítems no son dicotómicos.
TEMA 3: REPASO FIABILIDAD He creado un test de 10 ítems para medir la autoestima en adolescentes (de entre 12 y 18 años). Las preguntas son tipo Likert con 5 opciones de respuesta. 1 significa nunca y 5 siempre. Se ha pasado el test en 3 de ESO antes de la clase de matemática. Eran las 12 de la mañana y entraba el sol por la ventana. Tenían examen de matemática. Hemos ido 2 investigadores y cada uno ha estado en una clase de 3º (3º de Eso A y 3º de ESO B). 1. ¿Cómo podría evaluar la fiabilidad? Explica que pasos tengo que seguir para poder estimar la fiabilidad de diferentes modos. 1. Alfa de Cronbach (se calcula la varianza de cada ítem, la puntuación del test en total y por último se saca alpha) 2. Dos mitades (se calcula el coeficiente de fiabilidad con las puntuaciones obtenidas de una única aplicación; si el test está formado por dos subtest, se crean dos grupos de puntuaciones; se aplica el test una sola vez y se obtiene la correlación entre dos partes del test más una corrección: Spearman-Brown) 2. ¿Cuáles serían las ventajas y las desventajas de cada forma de medir la fiabilidad? a) Alfa de Cronbach: ventajas (solo se necesita una aplicación a un solo grupo de sujetos) y desventajas (hay que usar el spss). b) Método de las formas paralelas: ventajas (minimiza la influencia de pérdida de muestra, ya que lo vuelves a pasar dentro de unas horas para no perder sujetos) y desventajas (hay que crear dos formas y se puede introducir nuevo error en la medida, ya que puede ser diferentes los errores la segunda vez que vuelves a pasar el test)
c) Test-Retest: ventajas (hay que calcular el coeficiente de estabilidad y en esta estimación obtenida se ve hasta qué punto esa medida es estable) y desventajas (puede resultar complicado aplicar el mismo test dos veces a las mismas personas; los participantes pueden recordar su respuesta y responder de la misma forma de modo que se maximiza la consistencia; y puede haber cambios evolutivos normales) d) Dos mitades: ventajas (es un proceso simple, ya que es un solo test) y desventajas (hay que dividirlo en pares-impares, pero puede hacerse de otra manera; e infraestima la fiabilidad porque la correlación es entre mitades y no sabemos hasta qué punto están midiendo lo mismo por separado).
3. ¿De qué dos maneras podrían aumentar la fiabilidad de este test? ¿Qué podría hacer en este caso? •
Mediante la variabilidad y la longitud del test (número de ítems).
•
En este caso sería conveniente aumentar la variabilidad, ya que en muestras de mayor tamaño suele haber mayor dispersión en las puntuaciones y mayor variabilidad porque puede haber más diferencias entre ellos. 4. ¿Cuáles han sido las fuentes de error en este caso? La situación en la que se aplica el test (hacía sol y eran ya las 12 de la mañana);
los participantes se encuentran cansados; hay poca motivación para realizar el test; tienen estrés en ese momento, ya que la siguiente hora tienen un examen de matemáticas...
PRÁCTICA: ANÁLISIS FACTORIAL Haz el análisis factorial del test de ansiedad social, consta de 17 ítems. 1) ¿Cumple las condiciones para hacer un análisis factorial? (KMO y la prueba de esfericidad de Bartlett) KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity
,666 Approx. Chi-Square df
136
Sig.
,000
→ La prueba KMO da 0’66, por lo que es mayor que 0,5 y es significativo (< 0.05)
2) ¿Cuantos factores hay? ¿Qué porcentaje de la varianza explican? → Hay tres factores. → El porcentaje de la varianza es 73’62.
802,560
Total Variance Explained Initial Eigenvalues Compone nt 1 2 3 4
Total % of Variance 6,496 38,214 3,570 21,000 2,449 14,408 ,947 5,571
Cumulative % 38,214 59,215 73,623 79,194
5
,723
4,253
83,447
6
,534
3,141
86,589
7
,475
2,792
89,381
8
,447
2,631
92,012
9
,329
1,938
93,949
10
,271
1,591
95,541
11
,245
1,440
96,981
12
,192
1,129
98,110
13
,121
,714
98,824
14
,093
,550
99,374
15
,062
,362
99,736
16
,027
,156
99,892
17
,018
,108
100,000
Extraction Method: Principal Component Analysis.
Extraction Sums of Squared Loadings Cumul ative % of Total % Variance 6,496 38,214 38,214 3,570 21,000 59,215 2,449 14,408 73,623
Rotation Sums of Squared Loadings
Total % of Variance 4,476 26,332 4,219 24,819 3,820 22,471
Cumulative % 26,332 51,151 73,623
3) ¿Teniendo en cuenta el contenido de los ítems que nombre o etiqueta les darías a los factores? → Factor 1 = preocupación por lo que los demás digan → Factor 2 = ansiedad desconocidos → Factor 3 = ansiedad en público 4) ¿Hay alguna variable compleja? No, porque un factor puntúa 0’34 (ítem 1 y 2) 5) ¿Hay factores monopolares? ¿Y bipolares? Hay un factor monopolar, que es el factor 3 y dos factores bipolares que son el factor 1 y 2.
Para analizar la validez de constructo se empleó el análisis factorial exploratorio. Por un lado, se verificó que sí reunía los criterios necesarios para poder realizarlo, mediante el test de Kaiser-Meyer-Olkin, que obtuvo un valor de 0.66, y el test de esfericidad de Barlett, que resultó estadísticamente significativo (p < .000). Este análisis demostró una estructura subyacente compuesta por dos factores, los cuales, en conjunto, explicaban el 73% de la varianza total de los resultados. El factor 1 (preocupación por lo que los demás digan) está compuesto por 7
ítems, en concreto por los ítems 10, 3, 1, 15, 17, 12 y 6. El factor 2 denominado amabilidad (ansiedad desconocidos), está compuesto por 5 ítems, específicamente los ítems número 13, 7, 5, 9 y 14. Y, por último, el factor 3 (ansiedad en público) compuesto por el ítem 2, 4, 16, 11 y 8.
TEMA 4: VALIDEZ Y LONGITUD
(1 − rxx´ )( rXV ) 2 n= (rxv ) 2 − (rXV ) 2 (rxx´ )
rxy n rx y = 1+ (n − 1)rxx´
1) La fiabilidad de un test es de 0,60 y su validez de 0,50. ¿Cuál sería su validez si duplicamos su longitud? rxy=
0′50√2 √1+(2−1)𝑥0′60
= 0’56
2) La fiabilidad de un test es de 0,75 y su validez de 0,60. ¿Cuál sería su validez si ampliamos su longitud 2,3?
rxy=
0′60√2′3 √1+(2′3−1)𝑥0′75
= 0’65
3) La fiabilidad de un test de 30 ítems es de 0,76 y su validez de 0,89. ¿Cuantos ítems deberíamos de incluir en el test para conseguir una validez de 0,95? n=
-
(1−0′ 76)𝑥 (0′ 95𝑥0′95)
= 0’21/ 0’79-0’68= 1’9 x30 = 57 -30 = 27 ítems
(0′ 89𝑥0′89)−(0′ 95𝑥0′95)𝑥(0′ 76)
Habría que alargar el test 1’9 veces y dado que el test original constaba de 30 ítems, el nuevo alargado tendría que tener 57 ítems. Luego habría que añadir 27 ítems.
4) La fiabilidad de un test de 10 ítems es de 0,65 y su validez de 0,45. ¿Cuantos ítems deberíamos de incluir en el test para conseguir una validez de 0,50? n= (0′ -
(1−0′ 65)𝑥 (0′ 50𝑥0′50) 45𝑥0′ 45)−(0′ 50𝑥0′ 50)𝑥(0′ 65)
= 2’25 x 10
=22’5 -10 = 12’5 ítems
Habría que alargar el test 12’5 veces y dado que el test original constaba de 10 ítems, el nuevo alargado tendría que tener 22 ítems. Luego habría que añadir 13 ítems.
TEMA 4: REPASO VALIDEZ 1) Señala a qué tipo de validez hace referencia cada uno de los siguientes análisis que se han utilizado para validar un test de comprensión. a) Se calcula la correlación entre el test y la nota obtenida en un examen que les han hecho los profesores VALIDEZ PREDICTIVA/RELATIVA AL CRITERIO. b) Se realiza un análisis factorial para ver cómo se agrupan los ítems VALIDEZ FACTORIAL (DEL CONSTRUCTO). c) Mediante unos expertos en la materia se ha comprobado si hay preguntas referentes a todos los apartados importantes que se quieren evaluar VALIDEZ DE CONTENIDOS. 2) Un psicólogo crea un test para evaluar la rapidez lectora en niños/as de 8 años. a) Si lo aplicamos en 100 niños/as y volvemos a aplicar el mismo test a los mismos niños/as tras pasar dos semanas, encontrando una correlación entre posiciones de 0,79, entonces ese 0,79 es indicador de COEFICIENTE DE FIABILIDAD b) Se ha hecho la correlación entre la puntuación obtenida en el test y el tiempo invertido en leer un libro, y encontramos que es una correlación de 0,86. Ese 0,86 es indicador de COEFICIENTE DE VALIDEZ 3) Señala si las siguientes frases son VERDADERAS o FALSAS y justifica tu respuesta. a) El análisis factorial es la técnica estadística que nos indica si el test está formado por una, dos, tres o más formas paralelas Falso. El análisis factorial nos indica cuántas variables latentes denominadas factores diferentes existen dentro del test.
b) Mediante la matriz multirrasgo-multimétodo se espera una validez como la siguiente: que las correlaciones entre las medidas de diferentes rasgos por el mismo método sean mayores a las correlaciones entre el mismo rasgo medido por diferentes métodos. Falso. Se espera que las correlaciones entre medidas del mismo rasgo con diferentes métodos sean superiores a las medidas de distintos rasgos por el mismo método. 4) Indica tres modos de aumentar la validez de un test. ♦ Reducir el error de medida ♦ Aumentar la variabilidad ♦ Aumentar la longitud del test porque aumenta la fiabilidad 5) La fiabilidad de un test es de 0,75 y su validez es de 0,65. De cuánto será su validez si duplicamos su longitud? rxx’=0,75, rxy=0,65, n=2 rxy= (0,65x√ 2)/( √[ 1 + (2 − 1)𝑥(0,75)) = 0,919/1,323 = 0,69
6) Un test de 30 ítems tiene una fiabilidad de 0,62 y una validez de 0,50. ¿Cuantos items le tendríamos que sumar para conseguir una validez de 0,60? rxx’=0,62, rxv=0,50, rXV=0,60 [(1−0,62) 𝑥 (0,60)(0,60)]
n=[(0,50)𝑥(0,50)−{(0,60)𝑥(0′60)(0,62)}]= 0,1368 /(0,25-0,2232) = 0,1368/0,0268 = 5,10 * 30= 153 ítems
7) El 49% de la varianza del rendimiento laboral (criterio) puede predecirse por un tests de motivación al trabajo. ¿cuál es el coeficiente de validez del test de motivación laboral? 49/100= 0.49 Coeficiente de determinación √0′49= 0.7 0’7= coeficiente de validez
8) La fiabilidad de un test es de 0,75 y su validez es de 0,70. ¿Cuál sería la validez del test si duplicásemos su longitud? rxy=
0’70 √2 0′987 = 1′75 = √1+(2−1) 0′75
0’56
9) En una muestra de 1000 personas, un psicólogo encontró que la fiabilidad de un test que medía paranoidismo era de 0,75. La fiabilidad del criterio fue de 0,80. La correlación entre las puntuaciones de las personas y el criterio es de 0,70. a) ¿Qué porcentaje de la varianza del criterio puede ser predicha por el test sabiendo sus puntuaciones? 0.70x0.70 = 0.49 // 0.49x100 = 49%
49%
49% de la varianza del criterio puede ser predecida por el test.
10) En la siguiente matriz se muestran las correlaciones de puntuaciones obtenidas por diferentes rasgos y diferentes métodos.
MÉTODO
RASGO
1
RASGO
RASGO
RASGO
A
B
C
MÉTODO
MÉTODO
MÉTODO
2
3
1
2
3
1
2
1
.84
2
.53
.87
3
.52
.65
.75
1
.47
.23
.22
.92
2
.22
.65
.40
.54
.93
3
.23
.45
.65
.57
.67
.89
1
.37
.10
.13
.36
.11
.13
.96
2
.13
.61
.31
.13
.57
.35
.45
.93
3
.13
.36
.57
.11
.31
.60
.44
.57
3
A
RASGO B
RASGO C
.91
a) Específica entre qué valores se encuentran los coeficientes de validez convergente para cada rasgo. RASGO A: → entre 0.52 y 0.65 RASGO B:→ entre 0.54 y 0.67 RASGO C: → entre 0.44 y 0.57 b) ¿Hay una buena validez convergente-discriminante? No hay validez convergente-discriminante porque las correlaciones entre las medidas de un mismo rasgo por distintos métodos no son elevadas.
PRÁCTICA: ANÁLISIS DE LOS ITMES 1) Abrir la base de datos denominada “Practica_analisis_items” 2) El test contiene 10 items. 3) Calcula los descriptivos, los índices de discriminación y los índices de validez.
ITEM
media
DT
α
ID