Medidas de posición PDF

Title Medidas de posición
Author Dr. Francisco Javier Cruz
Course Métodos Cuantitativos en Finanzas
Institution Universidad Nacional Autónoma de México
Pages 40
File Size 1.2 MB
File Type PDF
Total Downloads 52
Total Views 134

Summary

Explicación de las principales medidas estadísticas de posición (cuartiles, deciles, percentiles)...


Description

ESTADÍSTICA DESCRIPTIVA Medidas de Tendencia Central Forma Medidas de Posición k

∑X i =1

f

i i

ESTADÍSTICA DESCRIPTIVA Las medidas descriptivas son valores numéricos calculados a partir de la población o de una muestra y que nos resumen la información contenida en ella.

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL El comportamiento de una variable observada en una población o de una muestra, puede resumirse mediante una serie de valores representativos llamados parámetros o estadísticos, según sea el caso de una población o de una muestra. Se denominan medidas de tendencia central o de centralización, a aquellos valores numéricos en torno a los cuales se agrupan, en mayor o menor medida, los valores de una variable estadística. Las tres medidas más usuales de tendencia central son: 9 La Media aritmética 9 La Mediana 9 La Moda

MEDIA ARITMETICA Media Aritmética: Se define como el “centro de gravedad” de la distribución estadística de una variable. Sea X una variable cuantitativa donde X1 , X2, ….. Xk; y f1, f2 ,….. fk son sus respectivos valores y frecuencias, entonces a la media aritmética de X la denotaremos por X si se trata de una muestra ó µ si se analiza una población, luego: k

∑x f i

X=

i

i =1

=

n

x1 f1 + x2 f 2 + ....+ xk f k n

k

µ =

∑x f i

i =1

N

i

=

x1 f1 + x2 f 2 + .... + xk fk N

CALCULO DE LA MEDIA ARITMETICA Caso de una Distribución de Frecuencia de Datos No Agrupados: Ejemplo: Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de empezar a caminar:

CALCULO DE LA MEDIA ARITMETICA Luego: k

i

X=

Meses (x) 9 10 11 12 13 14 15

i= 1

n

Niños (f) 1 4 9 16 11 8 1

i

=

x 1 f 1 + x 2 f 2 + .... + x k f k 610 = = 12,2 meses 50 n

xf 9 40 99 192 143 112 15 610

Distribución del Tiempo de Primeros Pasos

Cantidad de Niños

∑x f

18 16 14 12 10 8 6 4 2 0

Ubicación de la Media Aritmética

7

9

11

12,2

13

Número de Meses

15

17

CALCULO DE LA MEDIA ARITMETICA Caso de una Distribución de Frecuencia de Datos Agrupados: Ejemplo: Las alturas de los jugadores de un equipo de basquet vienen dadas por la tabla:

CALCULO DE LA MEDIA ARITMETICA Luego: Nº de jugadores 1 3 4 8 5 2 23

Altura (cms) [170, 175) [175, 180) [180, 185) [185, 190) [190, 195) [195, 2.00]

x 172,5 177,5 182,5 187,5 192,5 197,5

xf 172,5 532,5 730 1500 962,5 395 4292,5

8

k

∑x f i

X=

i =1

n

i

4292,5 = = 186,63 cm 23

No. Jugadores

7 6 5 4 3 2 1 172,5

177,5

182,5

187,5 X

Estatura (cm)

192,5

197,5

1. Si sumamos o restamos una constante a todos los valores de una variable manteniendo fijas las frecuencias entonces la media de la nueva variable así generada será igual a la media de la variable original más o menos la constante, según sea el caso: Sean X1 , X2 , ….. Xk y f1 , f2 ,….. fk los valores de la variable X y sus respectivas frecuencias y cuya media es X , entonces si sumamos o restamos una constante C a cada valor de X para así generar la variable Y, es decir: Y1 = X1 ± C ; Y2= X2 ± C ; ……Yk,=X k ± C, manteniendo Y las mismas frecuencias que X entonces:

Y = X ±C 2. Si multiplicamos o dividimos por una constante a todos los valores de una variable manteniendo fijas las frecuencias entonces la media de la nueva variable así generada será igual a la media de la variable original multiplicada o dividida por la constante, según sea el caso:

Y = X ×C Y = X /C

3. La suma de las diferencias de la variable con respecto a la media es nula, es decir: k

∑ (x − X ) f i

i

=0

i= 1

4. La suma de los desvíos de los valores de una variable respecto a la media aritmética de éstos es un mínimo, es decir: k

k

i =1

i =1

∑ ( xi − X )2 f i < ∑ ( xi − C )2 f i ∀C ≠ X

OBSERVACIONES SOBRE LA MEDIA ARITMETICA 1. La media se puede hallar sólo para variables cuantitativas. 2. La media es independiente de las amplitudes de los intervalos. 3. La media es muy sensible a las puntuaciones extremas.

La Media pierde Representatividad

Valores Extremos

X

4. La media no se puede calcular si hay un intervalo o clase abierto (con una amplitud indeterminada) 5. La media es un estadístico “suficiente” porque usa toda la información de la muestra.

MEDIANA Mediana Se define como el valor de la variable que divide la distribución en dos partes iguales. Es decir, el 50% de los datos es menor o igual a él y el restante 50% es mayor o igual a él. Se denota Me

El restante 50% de los datos de distribución son ≥ Me

El 50% de los primeros datos de la distribución son ≤ Me

Me

CALCULO DE LA MEDIANA Caso de una Distribución de Frecuencia de Datos No Agrupados: Procedimiento: 1. Ordenar las observaciones en orden creciente o decreciente. 2. Calcular j = (n + 1)/2 3. Si “j” es un número entero: Me = Xj 4. Si “j” no es un entero, Me = (xi + xk) / 2 donde “i” es el entero de “j” y k = i + 1 El mismo procedimiento expresado de otro modo: 1. Si el número de observaciones es impar, la mediana es el valor que ocupa el lugar central. 2. Si el número es par, la mediana es la media de los dos valores centrales.

CALCULO DE LA MEDIANA Ejemplo: Caso del pediatra Meses (x) 9 10 11 12 13 14 15

Niños (f) 1 4 9 16 11 8 1 50

F 1 5 14 30 41 49 50

En este caso j= (n+1)/2 = (50+1)/2 =25,5 Luego, i = 25 y k = 26, entonces: X25 = 12 meses , x26 = 12 meses

⇒ Me = (x25 + x26)/2= 12 meses

Vemos que efectivamente hay 25 (50%) valores ≤ a 12 y 25 (50%) ≥ a 12.

Importante : la fórmula no nos proporciona el valor de la Me, sino el número de caso en donde está la Me.

CALCULO DE LA MEDIANA Si organizamos la serie de datos anterior denotando la posición que ocupa cada observación tenemos: X 9, 10, 10, 10, 10, 11, 11, 11, ….. 11, 12, 12,…12, 12,……50 Posición: 1ª, 2ª, 3ª, 4ª, 5ª, 6ª, 7ª, 8ª,……,14ª, 15ª,16ª,…25ª,26ª,..50ª

16

No.Niños

14 12 10 8 6 4 2 9

10

11

12 X Me Meses

13

14

15

CALCULO DE LA MEDIANA Caso de una Distribución de Frecuencia de Datos Agrupados: Procedimiento: 1. Calcular j = (n + 1)/2 2. El intervalo que contiene la observación Xj es el que contiene Me 3. El valor de Me se obtiene por interpolación:

M e = LI Me

n  − FMe −1 +2 f Me   

   × i Me   

CALCULO DE LA MEDIANA

Donde: LIMe = limite inferior de clase que contiene a la Me

FMe-1 = Frecuencia acumulada hasta la clase inmediata anterior a la clase que contiene a la Me fMe = la frecuencia de la clase que contiene a la Me ; y iMe = El tamaño del intervalo (o clase) que contiene a la Me

CALCULO DE LA MEDIANA Caso de una Distribución de Frecuencia de Datos Agrupados Ejemplo: Caso de la estatura de los jugadores de basquet

CALCULO DE LA MEDIANA En el ejemplo: (n+1)/2 = 12 no existe frecuencia acumulada igual a 12 por lo tanto buscamos la frecuencia acumulada inmediata superior F4 = 16, luego la clase que contiene a la Me es la cuarta clase entonces:  n  − Fme −1  11 ,5 − 8   × i me = 185 +  M e = LI me +  2  × 5 = 187 ,1875 cms f me 8         8

No. Jugadores

7 6 5 4 3 2 1 172,5

177,5

182,5 X 187,5 Estatura (cms)

192,5

197,5

CALCULO DE LA MEDIANA Analizando trigonométricamente los triangulos rectángulos ABC y ADE se genera la formula de interpolación de la Mediana:

n : : E

Fme

C

n/2 Fme-1

A

B

D

M e = LI Me

: : F2

F1

l1

L1

Me

L2 ………. Lme-1

Lme ……………

n  − FMe −1 +2 f Me   

   × i Me   

OBSERVACIONES ACERCA DE LA MEDIANA 1. La mediana no está influenciada por los valores extremos ya que su determinación se apoya en los valores centrales de la variable La Media pierde Representatividad

Me

Valores Extremos

X

2. Su uso es apropiado ante distribuciones asimétricas 3. No es un estadístico “suficiente” ya que no aprovecha toda la información de la muestra, pero es un parámetro bueno para representar el valor típico de una población.

MODA Moda Se define como el valor de la variable que más se repite, es decir, el valor de la variable que tenga frecuencia máxima. Se denota con Mo Mo = Xj si y solo si fj = Max { fi, i=1, 2, 3,…..k} Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.

CALCULO DE LA MODA Caso de una Distribución de Frecuencia de Datos No Agrupados: Procedimiento: Determinar la frecuencia máxima, fmax, la moda será igual al valor de la variable asociado a dicha frecuencia. Ejemplo:

En este caso fmax = 16, por lo tanto, Mo = 12 meses

CALCULO DE LA MODA Caso de una Distribución de Frecuencia de Datos Agrupados: Procedimiento: Determinar la frecuencia máxima, fmax, la moda estará ubicada en la clase correspondiente a dicha frecuencia máxima y entonces:

M o = LI mo +

∆1 × i mo ∆1 + ∆ 2

∆ 1 = f mo − f mo −1 ∆ 2 = f mo − f mo +1 Donde:

fmo = frecuencia de la clase que contiene al Mo fmo-1= frecuencia de la clase anterior a la que contiene al Mo fmo-1= frecuencia de la clase siguiente a la que contiene al Mo

CALCULO DE LA MODA Caso de una Distribución de Frecuencia de Datos Agrupados en intervalos distintos: El intervalo modal será aquel con mayor densidad de frecuencia. Procedimiento:

M o = LI mo +

∆1 × i mo ∆1 + ∆ 2

∆ 1 = d mo − d mo −1 ∆ 2 = d mo − d mo +1 di =

ni LS i − LI i

Donde:

dmo = densidad de la clase que contiene al Mo dmo-1= densidad de la clase anterior a la que contiene al Mo dmo-1= densidad de la clase siguiente a la que contiene al Mo

CALCULO DE LA MODA Altura (cms) [170, 175) [175, 180) [180, 185) [185, 190) [190, 195) [195, 2.00]

Ejemplo: Caso de los jugadores Fmax = 8

Nº de jugadores 1 3 4 8 5 2 23

∆1 4 × imo = 185 + 5 = 187 ,8571 cm ∆1 + ∆ 2 4+3 − f mo −1 = 8 − 4 = 4

M o = LI mo + ∆ 1 = f mo

∆ 2 = f mo − f mo +1 = 8 − 5 = 3

Me= 187,18 cm Mo = 187, 86 cm

8 7 No. Jugadores

X = 186,63 cm

6 5 4 3 2 1 172,5

177,5

182,5

187,5

Estatura (cms)

192,5

197,5

OBSERVACIONES ACERCA DE LA MODA 1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de intervalos, y relativa). 2. La moda tiene la ventaja de no ser afectada por valores extremos. 3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos. 4. En muchas series de datos no hay moda porque ningún valor aparece más de una vez. 5. No es un estadístico aceptable porque pueda variar ampliamente de una muestra a otra.

COMENTARIOS SOBRE LAS MEDIDAS DE TENDENCIA CENTRAL

1. La media es una medida solamente aplicable a mediciones por intervalos o de razón. 2. La mediana es una medida de posición propia de los niveles de medición ordinal, por intervalos y de razón. No tiene sentido con variables nominales. 3. La moda se utiliza con cualquier nivel de medición. 4. Generalmente, la media aritmética es la mejor medida de posición en el caso de datos muestrales por ser el valor más estable de las tres medidas de posición. 5. La mediana es, por lo general, una buena medida de posición para la descripción de datos de una población.

ASIMETRIA Y CURTOSIS

ASIMETRÍA

1. En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente: Media – Moda = 3(Media – Mediana) 2. Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda respectivamente, para curvas simétricas los tres valores coinciden

Asimetría hacia la izquierda o negativa

Simetría

Asimetría hacia la derecha o positiva

CURTOSIS

Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis , podemos identificar si existe una gran concentración de valores ( Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica ).

CURTOSIS



Si este coeficiente es nulo, la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.



Si el coeficiente es positivo, la distribución se llama leptocúrtica, más puntiaguda que la anterior. Hay una mayor concentración de los datos en torno a la media.



Si el coeficiente es negativo, la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. sería más achatada que la primera.

MEDIDAS DE TENDENCIA CENTRAL

Cuartiles ( Q k ) , k= 1, 2, 3 Son estadígrafos que dividen a una distribución de frecuencias en cuatro porciones iguales o intervalos Se representan por Q1 Q2 Q3 y se ilustran en el esquema siguiente:

k (n + 1) , 4

k = 1, 2 , 3 y 4

Ejemplo

Consideremos la siguiente tabla de temperaturas reportadas en los últimos 24 días en la ciudad de Buenos Aires:

Ordenando los datos tenemos: 25, 25, 25, 26, 26, 27, 27, 28, 28, 28, 28, 28, 29, 30, 30, 30, 31, 31, 31, 31, 31, 32, 32, 35

La posición del primer cuartil es:

Q11 =

1(24 + 1) 25 = = 6.25 4 4

lo que significa que el primer cuartil se encuentra entre la posición 6 y 7, por lo que el primer cuartil es:

Q1 = 27°C

Cuartiles con Datos agrupados

• Procedimiento : Similar al de la mediana (Me) pero en vez de n/2 se considera (k*n)/4.

kn / 4 − Fk − 1 Qk = LIk + ∗ ik fk

D e c i l e s ( Di ) , i = 1, 2, 3, ...9 Son 9 números que dividen a los datos en 10 pares iguales, cada uno con el 10% de los datos

• Procedimiento : Similar al de la mediana (Me) pero en vez de n/2 se considera (k*n)/10.

kn / 10 − Fk −1 Dk = LIk + ×i k fk

Percentiles ( Pi ) , k= 1, 2, 3, ...99 Son 99 números que dividen a los datos en 100 partes iguales, cada uno con el 1% de los datos

• Procedimiento : Similar al de la mediana (Me) pero en vez de n/2 se considera (k*n)/100.

kn / 100 − F k − 1 Pk = LI k + × ik fk...


Similar Free PDFs