Ejercicios resueltos - Practica 2 PDF

Title Ejercicios resueltos - Practica 2
Author Emiliano Angeli
Course Estadística
Institution Universidad Nacional de La Matanza
Pages 9
File Size 398.1 KB
File Type PDF
Total Downloads 71
Total Views 166

Summary

Ejercicios resueltos de Estadistica....


Description

Departamento de Ciencias Económicas – UNLaM

Estadística

RESOLUCIÓN ALGUNOS EJERCICIOS PRÁCTICA 2 TIPOS DE MEDIDAS 1- Con la información de la nota periodística del ejercicio 2 de la práctica 1 (P1) responder. Las respuestas ya estaban en el enunciado! El sistema no me deja cambiar el documento, se colgo el que tenía la respuesta. a) El enunciado era :

¿Cuál fue la proporción de hurtos cometidos por menores, durante el mes de setiembre de 2007 en el partido de La Matanza? Del gráfico obtenemos que la proporción de hurtos cometidos por menores Phurtos = 0,11 Respuesta: La proporción de hurtos cometidos por menores, durante el mes de setiembre de 2007 en el partido de La Matanza es del 11%. b) El enunciado era :

¿Cuál fue el porcentaje de asaltos cometidos por menores respecto de los hurtos cometidos por menores, durante el mes de setiembre de 2007 en el partido de La Matanza? Datos: Hurtos: 0,11 Asaltos: 0,12 R= 0,12 . 100 = 109,09% 0,11 Respuesta: Los asaltos cometidos por menores durante el mes de setiembre de 2007 en el partido de La Matanza fue el 109,09% de los hurtos cometidos también por menores en ese lugar y en esa fecha.

Interpretaciones alternativas: Por cada hurto cometido por menores se dieron 1,09 asaltos cometidos por menores durante el mes de septiembre de 2007 en La Matanza. Por cada 100 hurtos cometidos por menores se dieron 109 asaltos cometidos por menores durante el mes de septiembre de 2007 en La Matanza. c) El enunciado era :

¿Qué delito predominó entre los menores, durante el mes de setiembre de 2007 en el partido de La Matanza? Mo = otros Respuesta: El delito que predominó entre los menores, durante el mes de setiembre de 2007 en el partido de La Matanza es otros. 2- En relación al ejercicio 3 de la P1, determinar. a) Respuesta: Doce PyMEs de las encuestadas tienen un endeudamiento de a lo sumo bajo. Medida utilizada: Percentil. Medida de posición.

b) Arreglo ordenado de datos

-0-

Departamento de Ciencias Económicas – UNLaM

Estadística

Me = Medio Respuesta: El nivel de endeudamiento máximo de la mitad de las PyMEs es medio. Medida utilizada: Mediana. Medida de posición. c) El enunciado era :

¿Qué porcentaje de esas empresas tienen un endeudamiento superior a Medio? Arreglo ordenado de datos

100- K es la proporción de empresas que tienen un endeudamiento superior a Medio, contándolas son 14 de las 40. Entonces P = 14 . 100 = 0,35 x100 =35 % 40 Respuesta: El 35% de esas empresas tienen un endeudamiento superior a Medio. Medida utilizada: Complemento del Percentil k, (100 – k). Medida de posición. Si bien no nos piden en este ejercicio tenemos la siguiente información: 100 – K = 35  K = 100 – 35 = 65% Significa que el 65% de las PyMEs tienen un endeudamiento de a lo sumo Medio. d) El rubro que predomina en la muestra de PyMEs es el industrial. Medida utilizada: Modo e) Por cada PyME agrícola hay 1,44 PyMEs industriales en la muestra. Medida utilizada: Razón. 3- Con respecto al ejercicio 5 de la P1. a) La proporción de Técnicos que posee la fábrica “Ventiluz” es del 19,62%. b) En la planta de Mendoza hay una mayor proporción de empleados administrativos. c) La proporción de obreros de Mendoza en toda la fábrica es del 9,43%. d) Por cada trabajador no obrero hay 1,88 obreros en la fábrica. e) Para cada planta calcular la razón entre obreros y no obreros y comparar los resultados. R Bs. As. = 1,96 R Córdoba = 1,80 R Mendoza = 1,47 R chubut = 2,09 La planta de Chubut presenta la mayor relación entre obreros y no obreros ya que por cada trabajador no obrero hay 2,09 obreros. f) Por cada administrativo de la planta de Córdoba hay 6,7 obreros de la de Chubut. g) La categoría de empleados que predomina en la fábrica “Ventiluz” es la de obreros. h) La frecuencia 45 de la tabla conjunta permite determinar el Modo o moda en la planta de Buenos Aires. Interpretación: En la planta de Bs.As. predominan los obreros. 4- Utilizando los datos del ejercicio 9 de la P1 determinar, identificando en cada caso, la medida utilizada. a) La proporción de familias encuestadas que poseen a lo sumo 4 personas que trabajan bajo relación de dependencia es 0,96 (en porcentaje 96%). b) El número medio de personas que trabajan bajo relación de dependencia por familia es 2,56 personas. -1-

Departamento de Ciencias Económicas – UNLaM

Estadística

c) Por cada familia que posee 5 o más personas que trabajan bajo relación de dependencia hay 24 que poseen menos de 5 personas en iguales condiciones. d) El 50% de las familias posee como mínimo tres personas que trabajan bajo relación de dependencia. e) En la muestra predominan las familias que cuentan con tres personas que trabajan bajo relación de dependencia. f) El 85 % de las familias encuestadas posee una o más personas que trabajan bajo relación de dependencia. g) El máximo de personas que trabajan bajo relación de dependencia del 60 % de las familias encuestadas es de tres. 5- El saldo mensual promedio de la compañía es $221,53 mayor de $215 por lo cual cumple el requisito. 6- El vendedor está en lo correcto pues en promedio vendió $342,16. 7- El porcentaje de mujeres es del 20%. Datos y sugerencia tener en cuenta las siguientes relaciones.

X = $21000

X hombres $21840

X mujeres $17640

x

 x = n . X n  X =  Xhombres   Xmujeres

X=

8- a) El lugar geométrico de la media aritmética en el eje real es el centro de la distribución de datos. Es verdadero solamente si la distribución de los datos es simétrica porque X = Me . b) Todos los conjuntos de datos tienen promedio. Falso, si la variable es cualitativa no se puede determinar el promedio. c) En el cálculo de la media aritmética influyen los valores extremos. Verdadero. d) El valor del promedio supera a los valores que toman la mitad de los datos ordenados. En algunas ocasiones, si la distribución es asimétrica a derecha. 9- a) Para determinar la mediana se tienen en cuenta el valor de cada uno de los datos. Falso, para determinar la Me sólo se tiene en cuenta el valor central (cantidad impar de datos) o los valores centrales (cantidad par de datos). b) El valor que más se repite en un conjunto de datos recibe el nombre de media aritmética. Falso, se denomina modo o moda. c) Para un conjunto ordenado de 50 observaciones, la posición de la mediana será el valor de la vigésimo quinta observación en el arreglo. Falso, la Me será el promedio de la vigésimo quinta y de la vigésimo sexta observación en el arreglo ordenado. d) Los valores extremos de una distribución no influyen en la determinación de la mediana. Verdadero. 10- a) costo medio de la mano de obra por hora de la fábrica de electrodomésticos: $8,85 varianza: $2 42,53 b) ¿Por qué es necesario elevar al cuadrado las diferencias entre la media y los valores de los que se obtuvo el promedio, cuando se calcula la varianza de la población ? Para evitar la suma cero de los X i  X c) La proporción de mano de obra semicalificada es del 21,67%. d) La razón de la mano de obra no calificada respecto de la mano de obra calificada es 5,71. En la fábrica de electrodomésticos, durante ese mes, se utiliza por cada hora de mano de obra calificada 5,1 horas de mano de obra no calificada. e) La razón de la mano de obra semicalificada respecto de la calificada es 1,86. En la fábrica de electrodomésticos, durante ese mes, se utiliza por cada hora de mano de obra calificada 1,86 horas de mano de obra semicalificada. -2-

Departamento de Ciencias Económicas – UNLaM

Estadística

11Datos Mujer: X min 8 X máx. 26 Q1 =11 Me = 14 Hombres: X min 10 Q1 =12 Me = 17

Q 3 = 18 no hay valores raros X máx. 33 Q 3 = 23 no hay valores raros

El grupo de mujeres que resultó satisfecho con el producto en general es más joven que el de lo hombres que dijeron estar satisfechos con el producto. El 50% central de las mujeres tienen edades comprendidas entre 11 y 18 años mientras que la mitad central de los hombres varían entre los 12 y 23 años. El cuarto de mayor edad de los hombres está más disperso que el cuarto de mayor edad de las mujeres. Ambas distribuciones de edades son asimétricas a derecha pues el rango comprendido entre la Me y el Xmáx es mayor que el que va del Xmin. a la Me. 12a)

El boxplot de superior presenta asimetría a la derecha mientras que la distribución representa por el inferior es asimétrica a izquierda. b) El 50% central de los datos del boxplot de superior es más compacto, más concentrado que el 50% central de los datos del otro diagrama. Dentro de la mitad central el primer cuarto es menos disperso que el segundo en la distribución representada en la parte de arriba mientras que en la de abajo es justo al revés. El 25% inferior del boxplot inferior está menos disperso que el correspondiente de la otra distribución. El 25% superior del boxplot inferior está menos disperso que el correspondiente de la otra distribución. c) Ninguna de las distribuciones presentan valores raros. d) Los datos representados en el primer gráfico presenta un rango o amplitud total mayor al del segundo. a) la distribución representada en el boxplot de la izquierda presenta asimetría a derecha, la Me < X pues 55 < 60. b) El 50% central de los datos varía entre 51 y 63 aproximadamente. Dentro de la mitad central de los datos el primer cuarto es menos disperso que el segundo. El 25% inferior de la distribución es menos disperso que el 25% superior, el cual va de 63 hasta 102 aproximadamente. c) Presenta dos valores raros, uno aproximadamente igual a 84 y otro, extremo lejano, igual a 102 aproximadamente. d) El rango de la distribución es igual a 52 aproximadamente y las vallas superiores se encuentran la interna entre 81 y 84 y la externa entre 84 y102. La pueden calcular con la distancia intercuartil -3-

Departamento de Ciencias Económicas – UNLaM

Estadística

13- Analizar el boxplot referido a la edad de los empleados de una empresa. Les queda de tarea a ustedes teniendo en cuenta las respuestas del ejercicio 12. 14- Utilizando los datos del ejercicio 11 de la P1:

Adjunto el arreglo ordenado para que tengan a mano los valores. 5 9 112 114

19 115

20 21 115 120

22 120

23 25 34 125 128 132

38 67 80 98 99 100 105 109 109 110 110 137 140 142 144 148 150 154 160 165 170 270

a) Es una distribución prácticamente multimodal por eso es conveniente ubicar la zona predominante agrupando los datos en intervalos de clase. Las demás medidas son determinadas a partir de los datos listados (no los intervalos). I 3 - 30 30 - 57 57 - 84 84 - 111 111 - 138 138 - 165 165 - 192 192 - 219 219 - 246 246 - 273

fi 8 2 2 8 10 7 2 0 0 1 40

Fi 8 10 12 20 30 37 39 39 39 40

IMo= [111; 138) En las PyMEs predominan las que poseen entre 111 y 138 trabajadores. b) x =101,6 empleados c) Me =111 empleados La mitad de las PyMEs tienen como máximo 111 trabajadores. d) La distribución de la cantidad de personal de las PyMEs al ser multimodal la regla no sirve, si bien es asimétríca no sigue una orientación hacia la izquierda o hacia la derecha bien definida.

e) Graficar un boxplot e identificar si en alguna PyME la cantidad de personal es atípica. Xmin. = 5 Xmáx. = 270 Q1= 52,5 Me = 111 Q3= 138,5 d = 86

Vallas: Vii = 52,5 – 1,5 . 86 = negativo por lo que no existe.

Vsi = 138,5 + 129 = 267,5 los datos que superan este valor son outliers por lo tanto hay una PyMEs que tiene un valor atípico, es la PyME donde trabajan 270 personas. 15- Con respecto al ejercicio 13 de la P1. a) El 65% de las entidades financieras otorgaron como máximo 10 préstamos. (P65) b) El 75% de las entidades financieras otorgaron como mínimo 4 préstamos. (P25) c) Catorce entidades otorgaron como mínimo 12 préstamos. (n – Fi = 56 – 44) d) Treinta y cuatro entidades otorgaron menos de 10 préstamos. (Fi correspondiente a 9) e) A partir del arreglo de datos ordenados del ítem a), i. Determinar los cuartiles y el promedio de la cantidad de préstamos otorgados. Q1 = 4 Q 2= 8 Q 3= 12 x = 8,66 ii. Analizar simetría. La distribución no es simétrica pero como es multimodal no se puede hablar de sesgo positivo o negativo. iii. Graficar e interpretar el box-plot. Xmin. = 1 Xmáx. = 20 Q1= 4 Me = 8 Q3= 12 d=98 Vallas: Vii = 4 – 1,5 . 89 = negativo por lo que no existen valores raros en la parte inferior

de la distribución. -4-

Departamento de Ciencias Económicas – UNLaM

Estadística

Vsi = 1 2 + 12 = 24 supera al Xmáx. por lo que no existen valores raros en la parte superior de la distribución.

El boxplot presenta asimetría a la derecha. El 50% central de las entidades financieras otorgaron entre 4 y 12 préstamos . El 25% de las entidades financieras que menos cantidad de préstamos concedieron como mucho otorgaron 4 préstamos, este cuarto de la distribución está más concentrado que el cuarto superior. El 25% de las entidades financieras que más préstamos otorgó como mínimo dieron 12 préstamos. 16- Utilizando los datos y los gráficos confeccionados en el ejercicio 16 de la P1. Se alteró la numeración en los ejercicios de las respuestas de 15 salta a 17 que en realidad es el 16), por favor corrijan son 20 ejercicios y la numeración dice 22. Ya cambie el documento con la numeración correcta. a) Analizar los gráficos y extraer por lo menos tres conclusiones. Entre los obreros de esa industria predominan los que perciben un salario medio diario entre 34$ y 36$ aproximadamente. Más del 50% de los obreros perciben un salario medio diario entre 32$ y 36$ aproximadamente. La distribución de salarios medios diarios es ligeramente asimétrica a derecha. Entre los obreros de esa industria predominan los que perciben un salario medio diario entre $34 y $36 aproximadamente. En promedio, los obreros, cobran un salario medio diario aproximado de $35,45. La mitad de los obreros como máximo por día ganan aproximadamente $ 35,43. Del gráfico podemos concluir que la distribución es ligeramente asimétrica, como el promedio es levemente mayor a la mediana agregamos que es asimétrica a derecha. b) Hallar la razón entre los empleados que tienen un salario diario superior a 32 $ y los que tienen un salario diario inferior a dicho valor. Por cada obrero que gana menos de $32 diarios hay 18,4 obreros que perciben 32 $ o más por día. c) El salario diario del 80% de los empleados es superior a 33,1 $. d) El salario máximo del 40% de los empleados es 34,79 $. e) Inferior a 36,11 $ es el salario diario del 60% de los empleados. f) El salario mínimo del 25% de los empleados es 37,13 $. g) El 0% de los empleados tiene un salario diario inferior a los 20$. h) El 83,51% de los empleados tienen un salario diario superior a $33. 17- Con los datos de la matriz 2, determinar para qué variable (considerando antigüedad y cantidad de personal) la muestra es más heterogénea. Para la variable antigüedad. Se comparan los CV(x). 18- El programa del grupo A resultó menos heterogéneo en sus resultados. Grupo A: CV(x) = 25, 69% ; Grupo B: CV(x) = 42,68%. 19- Sí, existe mayor consistencia en los sueldos de los trabajadores no calificados. CV(x) Ejecutivos= 5,81%; CV(x)No calificados= 2,78 %. 20- A partir de los datos resumidos en la matriz 1. a) Algunas conclusiones. Entre los alumnos pasantes predominan los que requieren de una supervisión mínima y presentan un nivel rápido en el aprendizaje de nuevas tareas. No hay ningún pasante que necesite supervisión mínima y su nivel de rapidez en el aprendizaje sea lento. -5-

Departamento de Ciencias Económicas – UNLaM

Estadística

Por cada alumno pasante con máxima supervisión y aprendizaje lento hay dos alumnos pasantes que requieren una mínima supervisión y tiene una moderada rapidez en el aprendizaje de nuevas tareas (R= 4/2). b) Para la variable edad, diferenciando por nivel de supervisión requerido para desarrollar una nueva actividad en la pasantía, calcular las medidas necesarias para analizar y comparar simetría y homogeneidad. Este desarrollo para que no pierdan mucho tiempo tratando de contar los datos buscando en la matriz (la colgue debajo de los resultados de la práctica 1.

Edad y nivel de supervisión ME1 (anexo matrices ejemplos) V1 : Edad de los alumnos V2: “Nivel de supervisión requerida para desarrollar una nueva actividad en la pasantía”. Edad 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 36 37 39 subtotal

Nivel de supervisión requerida Mínima Moderada máxima 2 2 0 1 3 1 2 4 0 3 1 2 4 1 1 1 1 1 2 2 0 1 0 0 1 0 1 1 1 0 0 2 1 1 0 0 1 0 0 1 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 0 24 19 7

subtotal 4 5 6 6 6 3 4 1 2 2 3 1 1 1 1 1 1 1 1 50

Comparación de simetría Nivel de supervisión Mínima

X= 25,58 años

Me = 23,5 años

Mo= 23 años

Mo < Me < X asimetría a derecha Nivel de supervisión Moderada

X= 24,105 años

Me = 22 años

Mo= 21 años

Mo < Me < X asimetría a derecha Nivel de supervisión máxima

X= 23,86 años

Me = 23 años

Mo= 22 años

Mo < Me < X asimetría a derecha Rta: Las tres distribuciones de las edades de los pasantes según el nivel de supervisión requerida son asimétricas a derecha.

-6-

Departamento de Ciencias Económicas – UNLaM

Estadística

Comparación de homogeneidad Nivel de supervisión Mínima

CV(x) =

S 5, 397 .100  .100 21,10% X 25, 583

Nivel de supervisión Moderada

CV(x) =

S 5,141 .100  .100 21, 33% X 24,105

Nivel de supervisión máxima

CV(x) =

S 3,132 .100  .100 13,13% X 23,857

Rta: La distribución de la edad de los pasantes que requieren máxima supervisión es la más homogénea por presentar menor coeficiente de variación.

c) Representar gráficamente los boxplots de la variable edad por nivel de supervisión requerido para desarrollar una nueva actividad en la pasantía.

Cálculos auxiliares: Nivel de supervisión Mínima

Xmin. = 19 Xmáx. = 39 Q1= 22 Me = 23,5 Q3= 29 d=7 Vallas: Vii = 22 – 1,5 .7 = 11,5 < mínimo por lo que no existen valores raros en la parte inferior

de la distribución. Vsi = 29 + 10,5 = 39,5 supera al Xmáx. por lo que no existen valores raros en la parte superior de la distribución. Nivel de supervisión Moderada

Xmin. = 19 Xmáx. = 37 Q1= 20 Me = 22 Q3= 28 d=8 Vallas: Vii = 20 – 1,5 .8 = 8 < mínimo por lo que no existen valores raros en la parte inferior de

la distribución. Vsi = 28 + 12 = 40 supera al Xmáx. por lo que no existen valores raros en la parte superior de la distribución. Nivel de supervisión máxima

Xmin. = 20 Xmáx. = 29 Q1= 22 Me = 23 Q3= 27 d=5 Vallas: Vii = 22 – 1,5 .5 = 14,5 < mínimo por lo que no existen valores raros en la parte inferior

de la distribución. Vsi = 27 + 7,5 = 34,5 supera al Xmáx. por lo que no existen valores raros en la parte superior de la distribución. -7-

Departamento de Ciencias Económicas – UNLaM

Estadística

d) En los tres boxplot se visualiza el mismo tipo de asimetría que la determinada en b) aunque en el 3º se hace un poco más difícil, es mejor la claridad del análisis realizado a partir de b) la comparación d elas medidas de tendencia central.

-8-...


Similar Free PDFs