Unidad Didáctica 3 - Investigación educativa/Estadística. PDF

Title Unidad Didáctica 3 - Investigación educativa/Estadística.
Course Investigación Educativa
Institution Universidad de Navarra
Pages 17
File Size 711 KB
File Type PDF
Total Downloads 107
Total Views 324

Summary

UNIDAD DIDÁCTICA 31. La estadística descriptiva: conceptos previos. La estadística descriptiva. La estadística descriptiva es aquella parte de la estadística que persigue resumir o describir de forma clara las características de un conjunto de datos. Así, ante un conjunto de datos, la estadística de...


Description

INVESTIGACIÓN EDUCATIVA

UNIDAD DIDÁCTICA 3 1. La estadística descriptiva: conceptos previos. 1.1. La estadística descriptiva. La estadística descriptiva es aquella parte de la estadística que persigue resumir o describir de forma clara las características de un conjunto de datos. Así, ante un conjunto de datos, la estadística descriptiva los ordena; los representa gráficamente; los hace comparables; y nos proporciona una indicación del comportamiento característico o central del grupo, de la variabilidad o dispersión de las puntuaciones respecto al valor central, de la forma que toma la distribución de valores, así como del grado de asociación que se produce entre las variables. 1.2. Conceptos previos.  Población: conjunto o colección de persona, objetos, o eventos cuyas propiedades serán analizadas. Se distingue entre: o Población finita: aquella menor de 100.000 casos, sujetos, o eventos. o Población infinita: la superior a 100.000.  Muestra: parte representativa y suficiente de la población a la que se tiene acceso para el estudio. Es el grupo con el que se trabaja con la intención de generalizar los resultados a la población de partida. Las condiciones que necesariamente debe reunir son suficiencia y representatividad . o Pequeña: muestra menor de 30 casos. Requiere de técnicas estadísticas de análisis específicas. o Grande: mayor de 30.  Parámetro: valor numérico referido a una población. Es un valor que describe a una población y que se denota por letras griegas. Por ejemplo, la altura media de los habitantes de un pueblo.  Estadístico: valor numérico referido a la muestra. Describe o resume las características de las muestras, y se denota por letras latinas. Por ejemplo, la altura media de los componentes de la muestra.  Matriz de datos: ordenación de los datos recogidos por el investigador en filas y columnas, en las que se especifica las características de los mismos. Constituye el paso previo al análisis de los datos, y supone una importante tarea de recolección por parte del investigador.  Precisión de la medida: término técnico que se refiere a la unidad de medida usada. Está directamente relacionada con el instrumento de medida. Por ejemplo, una balanza que mida en gramos, su precisión será el gramo.  Valor exacto: el que se consigue por incrementos de uno. Es necesariamente resultado de contar, no de medir. Solamente puede tomar valores enteros por la naturaleza del rasgo que representa. Es propio de variables continuas cuantitativas discretas o discontinuas. La medida de las variables continuas es siempre aproximada y depende de la precisión del instrumento. Los valores que se obtengan serán enteros o fraccionarios. 

Límites de una medida: medida ± máximo error posible. Vienen determinados por:



Máximo error posible: ½ de la unidad de medida.

 Error relativo: razón entre el número de unidades en el máximo error posible, y el número de unidades de la medida. Este error nos proporciona una base para la comparación de medidas: Error absoluto/medida = máximo error posible/medida. De dos mediciones, aquella con el menor error relativo será la que posea la mayor exactitud. Y de dos medidas con la misma precisión, la mayor de las dos tendrá el menor error relativo y, por tanto, la mayor exactitud.

1

INVESTIGACIÓN EDUCATIVA Es importante, además, conocer el término sumatorio. Es un símbolo (∑) que representa todos los valores posibles de una variable (x)  ∑ni=¿? = xi Supongamos que tenemos puntuaciones de rendimiento académico de 6 sujetos: 4, 8, 3, 2, 1, y 4. Representamos estas puntuaciones en algebra por el símbolo X (variable), identificando con un subíndice a cada uno de los valores posibles de la variable. Donde el subíndice es un contador que puede asumir los valores entre 1 y n (número total de sujetos). De esta forma, nuestro ejemplo anterior, quedaría expresado algebraicamente como: X 1=4, X2=8, X3=3, X4=2, X5=1 y X6=4. Por otra parte, la forma más frecuente de expresar la operación suma de los elementos de la variable: X 1+X2+X++...+Xn es mediante el símbolo griego ∑, con objeto de abreviar la expresión simbólica anterior. De este modo, la operación sumar todos los elementos de la variable anterior quedará expresado por:

El subíndice "i=1" reflejado en la notación del sumatorio indica el comienzo de la serie secuencial de sumas. Si este valor asumiese, por ejemplo, el valor "i=4", la suma debería comenzar en este valor. Aplicado al caso anterior quedaría expresado como:

El superíndice "n" en la parte superior del sumatorio indica el final de la secuencia de las sumas. Por ejemplo, si en el caso anterior expresamos la suma de los tres primeros sujetos:

REGLAS DEL SUMATORIO ∑x ∑y ∑y - K ∑ (x+y)

Si K es cte;

= = = =

x1 + x2 + x3 + x4 + x5… y1 + y2 + y3 + y4 + y5 (y1 + y2 + y3 + y4 + y5 ) - K ∑x + ∑y

= (x1+y1) + (x2+y2) + (x3+y3) + (x4+y4) + (x5+y5) … ∑ (x-y) = ∑x - ∑y ∑ (xy) = x1y1 + x2y2 + x3y3 + x4y4 + x5y5… ≠ ∑x·∑y ∑x · ∑y = (x1 + x2 + x3 + x4 + x5…)·(y1 + y2 + y3 + y4 + y5 …) ∑x2 = x12 + x22 + x32 + x42 + x52… ≠ (∑x)2 (∑x)2 = (x1 + x2 + x3 + x4 + x5)2 ∑K = nK (n = número de casos de la muestra) ∑ (x+K) = ∑x + ∑K = ∑x + nK ∑ (x-K) ∑ (xK) ∑ (x+y)2

= = = =

(x1 + 4) + (x2 + 4) + (x3 + 4) + (x4 + 4) + (x 5 + 4)… ∑x - ∑K = ∑x - nK Kx1 + Kx2 + Kx3 + Kx4 + Kx5 … = K · ∑x ∑x2 + ∑y2 + 2 ∑xy

= (x1+y1)2 + (x2+y2)2 + (x3+y3)2 + (x4+y4)2 + (x5+y5)2…

EJEMPLOS:

2

INVESTIGACIÓN EDUCATIVA

a) = x1 + x2 + x3 + x4 + x5 = 5 + 3 + 2 + 4 + 6 = 20 ___________________________________________________________________________

b) = y3 + y4 + y5 = 5 + 3 + 5 = 13 ___________________________________________________________________________

c) = x12 + x22 + x32 + x42 + x52 = 52 + 32 + 22 + 42 + 62 = 25 + 9 + 4 +16 +36 = 90 ___________________________________________________________________________

d) = x1y1 + x2y2 + x3y3 + x4y4 + x5y5 = 57 + 32 + 25 + 43 + 65 =93 ___________________________________________________________________________

e) = (x1 + x2 + x3 + x4 + x5) 2 = (5 + 3 + 2 + 4 + 6) 2 = (20) 2 = 400 Comparando el ejemplo e con el ejemplo c, vemos como se cumple la regla 4. ___________________________________________________________________________

f) = 5x1 + 5x2 + 5x3 + 5x4 + 5x5 =5 5 + 53 + 52 + 54 + 56 = 100 Este caso también puede solucionarse aplicando la regla 8, así:

= = 520 = 100 ___________________________________________________________________________

3

INVESTIGACIÓN EDUCATIVA

g) = (y1 + y2 + y3 + y4 + y5 ) - 4 = (7 + 2 + 5 + 3 + 5) - 4 = 22 - 4 = 18 ___________________________________________________________________________

h)

= (x1 + 4) + (x2 + 4) + (x3 + 4) + (x4 + 4) + (x5 + 4) = (5 + 4) + (3 +4) + (2 + 4) + (4 + 4) + (6 + 4) = 40 Empleando la regla 6, la solución sería:

= = 20 + 20 = 40 ___________________________________________________________________________

i) = (x1 + x2 + x3 + x4 + x5)(y1 + y2 + y3 + y4 + y5 ) = 2022 = 440 Comparando el ejemplo i con el ejemplo d , vemos como se cumple la regla 3. ___________________________________________________________________________

j)

= (x1+y1) + (x2+y2) + (x3+y3) + (x4+y4) + (x5+y5) = (5+7) + (3+2) + (2+5) + (4+3) + (6+5) = 42 Empleando la regla 1, la solución sería:

= = 20 + 22 = 42 ___________________________________________________________________________

= (x1+y1)2 + (x2+y2)2 + (x3+y3)2 + (x4+y4)2 + (x5+y5)2 = = (5+7)2 + (3+2)2+ (2+5)2 + (4+3)2 + (6+5)2 = 122 + 52 +72 + 72 +112 = 388 Empleando la regla 8, la solución sería: k)

= = 90 + 112 + 293 = 388 ___________________________________________________________________________

2. Distribuciones de frecuencias. 4

INVESTIGACIÓN EDUCATIVA 2.1. Definición. Una distribución de frecuencias es un procedimiento que nos ayuda a ordenar, describir, y comprender mejor un conjunto de datos. Es una manera de presentar de forma ordenada todos los valores posibles registrando al lado de cada uno de ellos el número de veces que ha ocurrido. El número de veces que se repite el valor de una variable en la muestra recibe el nombre de frecuencia absoluta. Evidentemente, en cualquier distribución, la suma de todas las frecuencias absolutas debe ser igual al número de elementos de la muestra de la que se trate. Ese total se conoce como el tamaño de la muestra (N). Se llama frecuencia relativa al cociente entre la frecuencia absoluta y el tamaño de la muestra. Se refiere a la proporción de un valor en el total de los casos. Cuando el número de casos es elevado y los valores de la variable también lo son (más de 15-20), la distribución de frecuencias debe ser agrupada. En esa distribución las frecuencias se asignan a un intervalo de valores de la variable en lugar de asignarse a un único valor. EJEMPLO: Edades de 20 alumnos 18 18 19 19

18 19 21 18

21 18 20 19

19 18 19 19

Tabla de frecuencias

20 22 19 20

Xi 18 19 20

Ni 6 8 3

Fi 0.3 0.4 0.15

21 22

2 1 N = 20

0.1 0.05 1

2.2. Pasos a seguir en la construcción de una distribución agrupada. El primer paso consiste en calcular el recorrido, o distancia máxima entre la puntuación superior y la inferior. Después habrá que decidir cuál será la amplitud de los intervalos. Esta se determina mediante un tanteo y se aconseja que sea de tamaño impar, para que el punto medio o marca de clase sea un valor entero, y no fraccionario. Lo siguiente será establecer el número de intervalos que tendrá la distribución. Un criterio comúnmente aceptado es que haya entre 10-20 intervalos. Si existen menos de 10, la tosquedad del agrupamiento puede generar demasiadas inexactitudes en los cálculos, y más de 20 dificultaría excesivamente el trabajo numérico. Más adelante habrá que establecer el intervalo inferior o punto en el que arranca la distribución. Se suele comenzar en un número que sea múltiplo de la amplitud y que englobe la puntuación inferior. Por último, una vez establecidos todos los intervalos, se les asignan las frecuencias correspondientes al total de los valores en una tabla. EJEMPLO: Pongamos que 36 alumnos han sido sometidos a un test que admite una puntuación máxima de 20 puntos y una puntuación mínima de 0 puntos. Siendo sus resultados obtenidos los siguientes: 18 17 07 12 15 06 09 10 0 02 07 20 4 16 08 03 09 04 02 0 08 11 10 13 10 9 Intervalos 20-22 17-19 Fr 1 3 Fa 36 35

07 13

10 11

09 02

19 04

14 10

15 03

14-16 4 32

11-13 5 28

1º: Recorrido = 20 – 2 = 18 2º: Amplitud de los intervalos = 3. 3º: Número de intervalos = 7. 4º: Intervalo inferior = 2-4. 5º: Tabla. 8-10 11 23

5-7 4 12

2-4 8 8

∑ = 36

Al realizar unos análisis de datos a partir de una distribución de frecuencias agrupadas se asume que los valores se distribuyen por igual a lo largo del intervalo, y por ello, se considera que el

5

INVESTIGACIÓN EDUCATIVA punto medio o marca de clase es el valor más representativo del mismo. Como esta hipótesis no tiene por qué ser cierta siempre, a veces se producen pequeñas diferencias en los resultados de los análisis cuando se calculan por distribuciones agrupadas o cuando se calculan a partir de los datos sin agrupar. Siempre y cuando los agrupamientos no sean muy groseros, las diferencias no serán relevantes.

3. Expresión gráfica de un conjunto de datos. A menudo la interpretación de los resultados numéricos de un estudio estadístico resulta costosa. Por ello, es frecuente acompañarlos de representaciones gráficas que proporcionan de forma rápida y visual una idea general del comportamiento de la variable estudiada. Las representaciones gráficas deben entenderse como elementos auxiliares de la interpretación de los resultados. Entre los principales tipos encontramos: 3.1. Para variables continuas:  Histograma: gráfico de barras en el que el eje de abscisas (eje X) descansan las barras que tienen por centros los puntos medios de los intervalos, y por anchura la amplitud de los mismos. La altura de las barras la determinan las frecuencias absolutas que se recogen en el eje de ordenadas (eje Y).  Polígono de frecuencias : gráfico de líneas trazado sobre los puntos medios de los intervalos. Estos puntos medios se representan en el eje de abscisas (eje X), y las frecuencias absolutas en el eje de ordenadas (eje Y). Para no dejar el gráfico cortado en sus extremos se acostumbra a prolongar por ambos lados la línea poligonal hasta cortar el eje X a una distancia igual a la mitad de la amplitud de un intervalo, como si a esos datos les correspondiera una frecuencia cero. Este gráfico es muy útil para representar dos o más distribuciones sobre los mismos ejes, con objeto de estudiar comparativamente analogías y diferencias. o Curva de ojiva: el polígono de frecuencias se utiliza también para representar las frecuencias acumuladas, tanto absolutas como relativas, de una distribución, dando lugar a la curva de ojiva o polígono creciente. Siempre será creciente puesto que eje Y representa el eje de las frecuencias acumuladas. 3.2. Para variables discontinuas:  Gráfico de sectores: representación circular de una variable discontinua dividida en sectores, de forma tal que los ángulos y, por tanto, las áreas respectivas, deben ser proporcionales a las frecuencias.  Diagrama de barras: representa una distribución de frecuencias de una variable discontinua. Las barras que lo forman, teniendo la misma base, se apoyan sobre el eje X, y la altura viene dada por las frecuencias. Las barras en este caso no se tocan unas con otras, por la naturaleza de la variable que representan.  Pictograma: los rectángulos de un diagrama de barras son sustituidos por un dibujo alusivo a la variable analizada. Es importante que el gráfico vaya acompañado de un título que defina exactamente lo que los valores representan.

4. Transformación de las puntuaciones directas I: los cuantiles. 4.1. Ejemplo de interpretación de una puntuación. Si un alumno obtiene en una prueba de cálculo menta 41 puntos sobre 50, ¿qué podría pensarse de ese alumno? ¿Su rendimiento en cálculo ha sido alto, bajo, medio? Contando solamente con esta información podría afirmarse que la calificación representa un 82% de total, en consecuencia es improbable pensar que haya suspendido el examen. Pero para poder interpretar correctamente la puntuación es preciso contar con la información del resto de los alumnos del grupo. Si la prueba resultó fácil para el grupo, la calificación 41 puede representar solamente un rendimiento medio. Pero si, por el contrario, el examen fue muy difícil, el alumno con 41 puntos puede figurar entre los de mayor rendimiento o incluso ser el mejor.

4.2. Las puntuaciones transformadas.

6

INVESTIGACIÓN EDUCATIVA Las puntuaciones directas, resultado de la aplicación de cualquier prueba, test, examen o ejercicio, no son directamente ni interpretables ni comparables, sino que requieren de una información adicional para serlo. Requieren del comportamiento del grupo de referencia. Esta información adicional la proporcionan las puntuaciones transformadas, que consisten en transformar la puntuación original o directa en una puntuación que muestra de forma inmediata la situación que ocupa un sujeto en el grupo de referencia. Es decir, su situación en comparación con los demás miembros del grupo al que pertenece. Hay varios tipos de puntuaciones transformadas. En esta UD nos referimos a: 4.3. Los cuantiles. Un cuantil es un punto de una escala numérica que se supone abarca una serie de observaciones dividiéndola en dos grupos, cuyas respectivas proporciones se conocen. De este concepto derivan las fórmulas del percentil, decil, cuartil.  Percentil: Es el valor de la variable que deja por debajo de sí un correspondiente % de casos. Los posibles percentiles son 99 y dividen una serie de observaciones en 100 proporciones iguales. Así, el percentil 95 (Pc 95) se refiere a la puntuación de la escala que deja por debajo de sí al 95% de los casos, o percentil 5 (Pc 5) la puntuación directa que deja por debajo de sí al 5% del grupo.  Cuartiles: Los cuartiles dividen el total de las observaciones en 4 partes iguales o proporciones. Los posibles cuartiles son 3; el primero (Q 1) deja por debajo de 25% de los casos, el segundo cuartil al 50% y el tercero al 75%.  Deciles: Los deciles dividen el total de las observaciones en 10 partes iguales. Los posibles deciles son 9; el primero (D 1) deja por debajo al 10% del grupo, el segundo (D 2) al 20, el tercero (D3) al 30% y así sucesivamente hasta el decil 9 que deja por debajo al 90% de los casos. 4.4. Equivalencias entre puntuaciones. Entre los cuantiles se dan todo tipo de equivalencias: Ej.; el D9 equivale al Pc90; o el Q2 al Pc50 y al D5. También es lo mismo hablar del Q1, que del Pc25.

Es muy importante recordar que los cuantiles, que expresan un tanto por ciento como hemos visto, son unidades de medida desiguales, lo que impide que se pueda operar aritméticamente con ellas. 4.5. Cálculo de los cuantiles. PERCENTIL

Primero se halla el % del percentil por el que nos han preguntado con la siguiente fórmula: ( ) donde m es el percentil que queremos, y N es el tamaño de la muestra. Y después se sigue la fórmula:

Nos fijamos entonces en la F i-1 (frecuencia acumulada; fra) que contenga el valor que hemos obtenido en el primer paso, para poder escribir el Li del intervalo crítico, es decir, del intervalo que contiene el percentil. Para esto, es necesario contar con el margen de error.

7

INVESTIGACIÓN EDUCATIVA Seguidamente, nos centramos en la fa, es decir, en la frecuencia acumulada anterior al valor del percentil; la que abarque dicho valor, la del intervalo anterior. Después asignamos el valor a la fi (fr), que se corresponde con la frecuencia absoluta del intervalo crítico, el elegido en el que se encuentra el valor del percentil. Y por último, contamos con la ai, que se corresponde con la amplitud del intervalo (c). CUARTIL

Primero se halla el % del cuartil por el que nos han preguntado con la siguiente fórmula: ( m es el cuartil que queremos, y N es el tamaño de la muestra. Y después se sigue la fórmula:

) donde

Nos fijamos entonces en la F i-1 (frecuencia acumulada; fra) que contenga el valor que hemos obtenido en el primer paso. A continuación escribimos el Li del intervalo crítico, es decir, del intervalo que contiene el cuartil. Para esto, es necesario contar con el margen de error. Seguidamente, nos centramos en la fa, es decir, en la frecuencia acumulada anterior al valor del cuartil; la que abarque dicho valor, la del intervalo anterior. Después asignamos el valor a la fi (fr), que se corresponde con la frecuencia absoluta del intervalo crítico, el elegido en el que se encuentra el valor del cuartil. Y por último, contamos con la ai, que se corresponde con la amplitud del intervalo (c). DECIL

Primero se halla el % del decil por el que nos han preguntado con la siguiente fórmula: ( m es el decil que queremos, y N es el tamaño de la muestra. Y después se sigue la fórmula:

) donde

Nos fijamos entonces en la F i-1 (frecuencia acumulada; fra) que contenga el valor que hemos obtenido en el primer paso. A continuación escribimos el Li del intervalo crítico, es decir, del intervalo que contiene el decil. Para esto, es necesario contar con el margen de error. Seguidamente, nos centramos en la fa, es decir, en la frecuencia acumulada anterior al valor del decil; la que abarque dicho valor, la del intervalo anterior. Después asignamos el valor a la fi (fr), que se corresponde con la frecuencia absoluta del intervalo crítico, el elegido en el que se encuentra el valor del decil. Y por úl...


Similar Free PDFs