II - Medidas Estadísticas - WA PDF

Title II - Medidas Estadísticas - WA
Author Abel Barrena
Course Probabilidad y estadistica
Institution Universidad Privada del Norte
Pages 8
File Size 497.2 KB
File Type PDF
Total Downloads 44
Total Views 157

Summary

MEDIDAS ESTADISTICAS...


Description

WORKING ADULT ESTADÍSTICA GENERAL II UNIDAD –MEDIDAS ESTADÍSTICAS CONTENIDOS CONCEPTUALES UNIDAD 2: Medidas de Tendencia Central,

de Posición y Dispersión, Propiedades y Aplicaciones

a. Medidas de tendencia central. La media, mediana y moda. Propiedades y problemas de aplicación. b. Percentiles. Cálculo e interpretación. Problemas de aplicación. c. Medidas de dispersión: La desviación estándar. Propiedades y cálculos. Aplicaciones. El coeficiente de variación. Definición, propiedades y aplicaciones.

CONTENIDOS PROCEDIMENTALES UNIDAD 2: Calculan medidas de resumen Seleccionan la fórmula correspondiente y luego calculan e interpretan: a. Calculan e interpretan los valores de las medidas estadísticas más importantes usando una calculadora y/o con la ayuda de programas estadísticos. b. Resuelven problemas de aplicación de las principales medidas estadísticas.

UNIDAD 2: Medidas de Posición y Dispersión, Propiedades y Aplicaciones MEDIDAS ESTADISTICAS: En numerosas ocasiones, en vez de trabajar con todos los datos, es preferible disponer de una o más medidas descriptivas que resumen los datos de forma cuantitativa. Se trata, de resumir en unos cuantos valores la información más importante y útil contenida en un conjunto de datos, haciendo más fácil la comprensión y la comparación de las diversas características de las poblaciones o muestras. Las medidas estadísticas son medidas de resumen que se calculan a partir de una muestra y que describen ciertos aspectos de una serie o distribución de datos para poder tener un mejor conocimiento de la población. Las medidas estadísticas pretenden "resumir" la información de la "muestra" para poder tener así un mejor conocimiento de la población ALGUNAS CONSIDERACIONES PARA UNA MEDIDA ESTADISTICA: 1. Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo resultado numérico. 2. Usar todas las observaciones y no algunas de ellas solamente, de manera que si varía alguna observación la medida considerada debe reflejar esta variación. 3. Tener un significado concreto: la interpretación debe ser inmediata y sencilla. 4. Ser sencilla de calcular. 5. Prestarse fácilmente al cálculo algebraico: Lo que permitirá demostraciones más elegantes. 6. Ser poco sensible a las fluctuaciones muestrales. Esta condición es imprescindible en la Estadística Matemática y en la Teoría de Sondeos. CLASIFICACION DE LAS MEDIDAS ESTADÍSTICAS

Estadística General

1

WORKING ADULT MEDIDAS DE TENDENCIA CENTRAL Son valores que se ubican en la parte central de un conjunto de datos o de una distribución. Las medidas de centralización responden a la pregunta. ¿Alrededor de qué valor se agrupan los datos?.Estas medidas solo se calculan para variables cuantitativas. El conocimiento de estas medidas es de gran utilidad tanto en los niveles de decisión como de ejecución. Las principales medidas de tendencia central son: MUESTRA Media aritmética La Mediana La Moda

X me mo

POBLACION

 Me Mo

LA MEDIA ARITMÉTICA O PROMEDIO (  o ): Es el valor representativo de una población o conjunto de datos. También se llama Esperanza matemática, valor medio o promedio aritmético. Se obtiene sumando todos los valores de los datos observados y se divide entre el número total de ellos. Solo es aplicable para el tratamiento de datos cuantitativos. Existen dos formas de trabajar con los datos: sin agruparlos o agrupándolos en tablas de frecuencias. Fórmulas de cálculo de la media aritmética: POBLACION (N)

MUESTRA (n)

Datos sin Agrupar Datos Agrupados LA MEDIANA (Me): Valor que divide en dos partes iguales un conjunto de datos ordenados en forma ascendente o descendente. En otras palabras es el valor que ocupa del lugar central. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales. Es una medida de tendencia central que divide al total de n observaciones debidamente ordenadas o tabuladas en dos partes de igual tamaño, cada una con el 50% de los datos observados. Fórmulas de cálculo de la mediana: n es Impar

Datos no agrupados

Valor que está en la mitad de la serie ordenada

n es Par

Promedio de los 2 valores centrales

Datos Agrupados (TABLAS) Para datos no agrupados: Para calcular la mediana, los n datos originales 1) Se ordenan en forma ascendente o descendente los datos 2) Se halla el lugar en donde se encuentra la mediana Se presenta dos casos: a)

Para un número par de datos: La mediana será el promedio de los dos valores centrales.

Ejemplo: Calcular e interpretar la mediana de los gastos mensuales, por concepto de telefonía móvil de una empresa de reparaciones a domicilio Estadística General

2

WORKING ADULT Xi: 650, 750, 850, 1000, 750, 820, 850, 1200, 1000, 1000 1)

Ordenando en forma ascendente Xi: 650, 750, 750, 820, 850, 850, 1000, 1000, 1000, 1200 50%

Me

50%

2)

Como n = 10 (par)  se ubica el lugar en donde se encuentra la Me

3)

Interpretación: El 50% de los trabajadores tienen un ingreso máximo de S/. 850, el otro 50% supera dicho ingreso.

b) Para un número impar de datos: La mediana será el valor que está ocupando la posición central. Ejemplo: Los siguientes datos corresponden a los tiempos de acceso en minutos a 11 Páginas Web cargadas por la tarde en el horario de 14 a 15 horas desde una PC Xi:

2.9, 1.4, 1.2, 3.4, 1.3, 2.5, 1.6, 1.8, 2.3, 1.5, 1.0

Ordenando los datos en forma ascendente Xi: 1.0, 1.2, 1.3, 1.4, 1.5, 1.6, 1.8, 2.3, 2.5, 2.9, 3.4. Me 50% 50%

Interpretación: El 50% de las páginas Web son cargadas en un tiempo de acceso máximo de 1.6 minutos, el otro 50% supera dicho tiempo. LA MODA (Mo): Es el valor que ocurre con más frecuencia. Es especialmente útil para datos de tipos nominal, ordinal y de intervalos. Una distribución puede ser: amodal sino tiene ninguna moda, unimodal si tiene una moda, bimodal si tiene dos modas y multimodal si tiene tres o más modas.

PROPIEDADES DE LA MODA  La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de intervalos, y relativa).  La moda no es afectada por valores extremos. DESVENTAJAS DE LA MODA  En muchas series de datos no hay moda porque ningún valor aparece más de una vez.  En algunas series de datos hay más de una moda, en este caso uno podría preguntarse ¿cuál es el valor representativo de la serie de datos?

Estadística General

3

WORKING ADULT Para datos agrupados

Donde:

y

USO ADECUADO DE LA MEDIA, MEDIANA Y MODA.1°) La media aritmética tiene la ventaja de que toma en cuenta para su cálculo, la totalidad de los valores de la variable, aumentando o disminuyendo de acuerdo a ellos, pero a causa de este problema, puede tener la desventaja que es afectada por la existencia de valores muy altos o muy bajos en los extremos. En conclusión cuando el comportamiento de la variable es más o menos simétrico la media aritmética es la más recomendable. 2°) La mediana se usa cuando existe mucha dispersión de los datos. 3°) Así también la mediana es la más ventajosa en usarla cuando en el primer o último grupo o clase no tiene límite definido. 4°) La moda no es muy usual, pero se emplea cuando se quiere conocer el valore que se presenta más frecuentemente. MEDIDAS DE POSICION CUARTILES (Qi): Se denotan por Qi, donde k=1, 2, 3. Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir, cada sector tiene el 25% de los datos. El Q2 coincide con la mediana. Para calcular los cuartiles se utilizan las fórmulas adecuadas ya sea si son datos agrupados o datos no agrupados. Formula: DECILES (Di): Se denotan por Di, donde i=1,2,3,4,5,6,7,8,9. Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir, cada sector tiene el 10% de los datos.D 5 coincide con la mediana. Formula:

PERCENTILES (Pi):Se denotan por Pi, donde i=1,2,3,4,5,6,7,8,9,10, … , 99. Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir, cada sector tiene el 1% de los datos. Formula: MEDIDAS DE DISPERSIÓN Rango

Coeficiente de

Medidas de

Variación

Dispersión

Varianza

Desviación estándar

Estadística General

4

WORKING ADULT

Son indicadores estadísticos que representan cuan dispersas se encuentran los datos de la variable, señalándonos el grado de concentración de los mismos con respecto al promedio de la distribución. Las medidas de dispersión se usan para: a) Verificar la confiabilidad de los promedios. b) Establecer como base para el control de la variable. Así tenemos: 

Alta dispersión (medida de dispersión alta) --- baja concentración alrededor del promedio. DATOS HETEROGENEOS



Baja dispersión (medida de dispersión baja) -- Alta concentración alrededor del promedio. DATOS HOMOGENEOS

Las medidas de dispersión más usuales son: MUESTRA R S2 S

 Rango  Varianza  Desviación estándar

POBLACION R

RANGO: R = Max – Min. Se denota por R y la medida de variabilidad más fácil de calcular. Es la diferencia que existe entre el valor máximo y el valor mínimo del conjunto de datos. Su uso es muy limitado, pues solo toma en cuenta los valores extremos VARIANZA (σ2): Mide la variabilidad de un conjunto de datos respecto a un valor central (promedio). Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilógica su interpretación. Para calcular la varianza se utilizan las fórmulas adecuadas ya sea sin son datos agrupados o datos no agrupados. POBLACION N

DATOS SIN AGRUPAR

 x

2 

N

2 

 X

i

n

2

i 1

N

DATOS AGRUPADOS

 

i

MUESTRA

N

2

i

S2 

i 1

n 1 n

  2 . f i

i 1

  x  x

S2 

 X

i

 x 2 . f i

i 1

n 1

Donde: xi Xi

valores de la variable X marca de clase de cada variable o grupo

N n

tamaño de la población tamaño de la muestra

2

Varianza poblacional

2

S

Estadística General

Varianza muestral

5

WORKING ADULT DESVIACIÓN ESTANDAR (σ): Mide la variabilidad de un conjunto de datos respecto a su valor central pero en unidades originales. Esta es la medida de variabilidad que tiene una interpretación lógica. Se obtiene al sacar la raíz cuadrada de la varianza.

  

S  S2

2

COEFICIENTE DE VARIACIÓN (CV):Es el grado de desviación con relación a la media. Este coeficiente se usa para comparar las medias aritméticas o promedio de diferentes muestras. El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento homogéneo o heterogéneo, de acuerdo al valor obtenido: Coeficiente de variación (en %) 0 0 < CV  10 10 < CV  15 15 < CV  20 20 < CV  25 CV > 25 o o

Calificación de la distribución de datos Completamente homogénea Muy homogénea Regularmente homogénea Regularmente variable Variable Muy variable

Si el CV ≤ 25% Los datos tiene un comportamiento homogéneo. Si el CV >25% Los datos tiene un comportamiento heterogéneo.

Nota.- Cuanto menor es el C.V. mejor será la estimación del promedio y el proyecto será mejor.

C.V .  Donde:

C.V. = c.v =  = µ = S = X =

 *100% 

c. v. 

S *100% X

coeficiente de variación de la población coeficiente de variación muestral Desviación estándar poblacional Media aritmética poblacional Desviación estándar muestral Media aritmética muestral

Ejemplo: Considerar dos proyectos de inversión A y B. Ambos tienen una ganancia promedio igual a $ 500. La Desviación estándar es 63.25 y 215.35 respectivamente. Halle cuál de los dos proyectos es mejor. MEDIDAS µ  C.V.

Estadística General

A 500 63.25

B 500 215.35

6

WORKING ADULT EJERCICIOS: 1. La empresa A tiene 100 empleados, con su sueldo promedio mensual por empleado de $ 250. La empresa B tiene 200 empleados con un sueldo promedio mensual de $ 240. a. ¿Cuál es el sueldo promedio mensual de las dos empresas en conjunto? b. Si las dos empresas se agrega una tercera con 50 empleados y un sueldo promedio mensual por empleado de $ 300, ¿Cuál es el sueldo promedio para las tres empresas en conjunto? 2. El ingreso medio mensual de los 16,500 obreros de una compañía es de S/. 1160.00 y de los 12,900 empleados de esta compañía es de S/. 1480.00. Si los obreros reciben una aumento del 20% sobre sus ingresos más una bonificación de S/. 200.00 por condiciones de trabajo y los empleados reciben un aumento del 30% más S/. 500.00 por refrigerio. ¿Cuál es el ingreso promedio de todos los trabajadores de la compañía después del aumento? 3. Después de ser capacitados un grupo de trabajadores en una Empresa, rindieron un examen de evaluación, donde los resultados fueron Puntaje Nº Trabaj. a. b. c. d. e.

00 - 50 14

50 - 100 18

100 - 150 19

150 - 200 5

¿Cuál es el promedio de nota después de recibir una capacitación? ¿Cuál es la nota mediana después de recibir una capacitación? ¿Cuál es la nota más frecuente en el grupo de trabajadores? ¿A partir de qué puntaje se ubican en el tercio superior? ¿Los puntajes se comportan de forma homogénea?

4. En la sgte. tabla se presentan los ingresos mensuales de profesionales del área ambiental. Analice el comportamiento de la variable Ingreso mensual Nº Profesionales

5200

5400

5600

5800

6000

6200

16

23

17

41

32

21

5. Establezca, con base estadística, en cuál de las siguientes empresas el salario está repartido de forma más equitativa Empresa A Salario Nº de percibido personas (S/.) 15 800 20 1000 30 1200 20 1500 15 7500

Empresa B Salario Nº de percibido personas (S/.) 10 800 30 1000 35 1200 24 1500 1 7500

a) Calcular el promedio de salario percibido en el grupo de trabajadores de la Empresa A y de la Empresa B. b) ¿Cuál de las dos empresas tiene salarios más homogéneos?

Estadística General

7

WORKING ADULT 6. Se desea programar la producción de cierto tipo de jabón desodorante, en base al consumo de los clientes entrevistados. La mejor medida de tendencia central que usaría es: a. Media Aritmética

b. Mediana

c. Moda

7. La gerencia está preocupada por las faltas de sus trabajadores. Suponga que se tiene la siguiente relación sobre el número de faltas durante un año de 5 empleados 20, 22, 26, 27, 50 días. ¿Qué medida representaría mejor el número de faltas de los 5 empleados? a. Media Aritmética

b. Mediana

c. Moda

8. Se desea abrir una discoteca en Huanchaco, para lo cual se necesita conocer la edad promedio de los posibles clientes. Se toma como referencia la edad de los clientes que asisten a una discoteca con la cuál competirá. Esta información es necesaria para determinar la decoración de los ambientes de la nueva discoteca. ¿Cuál de las medidas se debe utilizar para determinar la edad representativa de los clientes? ¿Por qué? a. Media Aritmética 9.

b. Mediana

c. Moda

Un conjunto habitacional está conformado por tres edificios de departamentos. De estos edificios, se tiene los siguientes datos respecto al consumo mensual de electricidad de cada uno de los edificios: Edificio 1: Tiene 12 departamentos que gastan en promedio 45 soles con una desviación estándar de 10 soles. Edificio 2: Tiene 9 departamentos cuyos consumos en soles son 38, 42, 56, 60, 43, 52, 41, 44, 53. Edificio 3: Los consumos se dan en la siguiente tabla: Consumo en sol es

Departamentos

[30, 40)

1

[40, 50)

4

[50, 60)

4

[60,70)

2

a) ¿Cuál de los edificios tiene menor consumo promedio de electricidad? b) ¿Cuál es el consumo promedio en todo el conjunto habitacional? c) ¿En cuál de los edificios el consumo es más disperso?

Estadística General

8...


Similar Free PDFs