Actividad 5 - Uso y características de los datos agrupados PDF

Title Actividad 5 - Uso y características de los datos agrupados
Author CARLOS ANDRES RAMIREZ CASTILLO
Course psicologia
Institution Corporación Universitaria Iberoamericana
Pages 8
File Size 275.7 KB
File Type PDF
Total Downloads 101
Total Views 152

Summary

Download Actividad 5 - Uso y características de los datos agrupados PDF


Description

ACTIVIDAD 5 - USO Y CARACTERÍSTICAS DE LOS DATOS AGRUPADOS ESTADÍSTICA DESCRIPTIVA

CARLOS ANDRÉS RAMÍREZ CASTILLO

BYRON DAVID BONILLA MENDOZA PROFESOR

CORPORACIÓN UNIVERSITARIA IBEROAMERICANA FACULTAD DE CIENCIAS HUMANAS Y SOCIALES PSICOLOGÍA CAUCASIA 2020

UNIDAD 2 – TEMA 2. USO Y CARACTERÍSTICAS DE LOS DATOS AGRUPADOS Recuerde consultar la bibliografía sugerida y asistir a la sesión de tutoría con su profesor, antes de comenzar a desarrollar este caso. Entre algunos datos interesantes del DANE, se encuentra la caracterización de las empresas según su CIIU, y por cantidad de personas ocupadas en microempresas y pequeñas empresas. Analizando la situación laboral del país, se puede obtener la siguiente tabla1: Cuadro 4.31 Unidades económicas1 de comercio, por tamaño de la unidad económica, según áreas y código CIIU Total nacional 2005

Áreas y códigos CIIU2

00

Unidades económicas por rango de personal ocupado 1

2a5

193 210 12.780 3.340 6.636 1.841 990 962 235 208 173 2.119 40 983 465 945 311 136 293 45 440 368 418 48 74 68 107 116 747 33 34 16 48 43

462 471 23.072 6.090 6.324 1.629 1.258 933 479 336 314 2.832 84 796 882 923 539 300 485 206 640 537 1.152 127 188 149 291 598 1.210 109 178 50 202 230

6 a 10

11 a 20

21 a 50

Total nacional

5011 Compra-Venta Automóviles 5012 Compra-Venta Vehículos automotores 5020 Mantenimiento-Reparación Vehículos automotores 5030 Compra-Venta Autopartes, accesorios, lujos para vehículos 5040 Compra-Venta Motos y sus partes, piezas y accesorios 5051 Compra-Venta Combustible 5052 Compra-Venta Lubricantes, aditivos 5121 Compra-Venta Cereales 5122 Compra-Venta Café pergamino 5123 Compra-Venta Flores y plantas ornamentales 5124 Compra-Venta Cueros, pieles, animales vivos 5125 Compra-Venta Productos alimenticios 5126 Compra-Venta Café trillado 5127 Compra-Venta Bebidas alcohólicas, refrescos, aguas minerales 5131 Compra-Venta Textiles 5132 Compra-Venta Ropa en general, artículos de piel 5133 Compra-Venta Calzado, partes para calzado 5134 Compra-Venta Electrodomésticos, muebles para el hogar, cristalería 5135 Compra-Venta Drogas, cosméticos, perfumes 5136 Compra-Venta Equipos médicos y quirúrgicos 5137 Compra-Venta Papel y cartón, libros, revistas, periódicos, útiles 5139 Compra-Venta Artículos fotográficos y ópticos, juguetes, joyas 5141 Compra-Venta Materiales de construcción, ferretería, vidrio, madera 5142 Compra-Venta Pinturas 5151 Compra-Venta Combustibles sólidos, hulla, productos de la refinación 5152 Compra-Venta Metales, cobre, níquel, aluminio, minerales preciosos 5153 Compra-Venta Abonos, plaguicidas, químicos, plásticos y caucho 5154 Compra-Venta Fibras textiles naturales, artificiales y sintéticas 5155 Compra-Venta Chatarra, Material de reciclaje, Desperdicios o desecho 5159 Compra-Venta Piedras preciosas, abrasivos naturales, aceites esenciales 5161 Compra-Venta Maquinaria y equipo para agricultura, minería 5162 Compra-Venta Equipo de transporte para uso industrial 5163 Compra-Venta Maquinaría para oficina, contabilidad 5169 Compra-Venta Otra maquinaria

132 78 3.015 693 379 536 168 153 57 74 58 437 17 151 180 123 97 69 172 68 132 82 300 23 107 42 79 100 144 15 71 14 73 73

97 28 777 281 118 365 76 105 28 40 37 266 15 73 114 61 66 39 88 50 63 49 147 22 58 35 50 13 68 11 36 13 46 48

74 9 212 94 31 88 18 44 16 42 16 167 13 49 51 30 28 23 82 26 53 27 102 9 41 16 36 10 35 0 30 5 29 25

1 Datos tomados del censo poblacional del DANE, 2005. Tomado de dane.gov.co/censo/files/cuadros%20censo%202005.xls

5170 Mantenimiento-Reparación Maquinaria y equipo industrial 5190 Compra-Venta Otros productos diversos no incluidos en la lista 5211 Compra-Venta No especializado 5219 Compra-Venta No especializado 5221 Compra-Venta Frutas y verduras, productos agrícolas 5222 Compra-Venta Productos lácteos, leche, huevos 5223 Compra-Venta Carnes 5224 Compra-Venta Confitería, dulces 5225 Compra-Venta Cigarrerías, bebidas, tabaco 5229 Compra-Venta Otros alimentos 5231 Compra-Venta Drogas, cosméticos, perfumes 5232 Compra-Venta Textiles 5233 Compra-Venta Ropa en general y sus accesorios 5234 Compra-Venta Calzado, artículos de cuero, bolsos 5235 Compra-Venta Electrodomésticos 5236 Compra-Venta Muebles para el hogar 5237 Compra-Venta Productos para el hogar 5239 Compra-Venta Relojes, joyas, artículos deportivos, alfombras, flores 5241 Compra-Venta Ferreterías, cerrajerías, vidrio, marqueterías 5242 Compra-Venta Pinturas 5243 Compra-Venta Muebles para oficina, computadores y programas 5244 Compra-Venta Papelerías, librerías, útiles escolares 5245 Compra-Venta Cámaras fotográficas y sus accesorios 5246 Compra-Venta Gafas, lentes, equipo óptico, instrumentos de cálculo 5249 Compra-Venta Otros productos de consumo 5251 Compra-Venta Artículos usados (Libros, ropa, muebles, etc) 5252 Compra-Venta Compra-ventas o casas de empeño 5269 Otros tipos de comercio al por menor no realizado en establecimientos 5271 Mantenimiento-Reparación Efectos personales 5272 Mantenimiento-Reparación Enseres Domésticos 0000 No informa

3.099 1.949 108.019 39.139 26.273 7.398 12.729 15.609 23.896 9.996 9.977 4.792 31.218 8.607 1.954 2.504 5.557 3.960 7.504 807 366 7.550 552 758 9.055 4.302 1.490 0 10.061 13.675 0

5.047 3.258 64.667 17.796 16.376 5.029 9.929 4.841 12.532 6.684 9.283 3.965 19.116 7.600 3.108 3.106 4.442 3.824 11.188 1.334 961 5.217 680 1.136 6.500 2.321 2.335 0 4.145 7.518 0

879 831 1.503 429 614 231 438 140 450 294 755 409 827 529 391 316 328 234 1.167 113 137 379 93 75 495 65 68 0 143 352 0

366 510 543 113 157 73 150 47 137 101 237 163 271 126 191 73 136 50 406 42 44 128 28 23 203 23 10 0 69 78 0

194 271 335 47 104 45 60 22 35 56 86 67 125 21 112 38 48 12 160 13 22 81 4 3 88 10 4 0 14 37 0

Con los datos de la siguiente tabla, haremos una comparación entre uno de las unidades económicas resaltadas en verde (de libre elección), y el total nacional de unidades económicas, sumadas respecto al número de empleados (esto con el fin de tener una sola tabla totalizada). 1. Escoja una de las unidades económicas resaltadas en verde, y conforme con sus datos una tabla de frecuencias completa. Calcule también las medidas de tendencia central (media, mediana, moda) y las medidas de dispersión (desviación típica, varianza, desviación estándar). Caracterice la unidad económica según los datos obtenidos. Para desarrollar esta pregunta, se eligió el área de compra-venta ferreterías, cerrajerías, vidrio, marqueterías, obteniendo la siguiente tabla de frecuencias. Tabla 1. Tabla de frecuencias para los datos de compra-venta ferreterías, cerrajerías, vidrio, marqueterías Rango 1 2 3 4 5

TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS (COMPRA-VENTA FERRETERÍAS, CERRAJERÍAS, VIDRIO, MARQUETERÍAS) Unidades Límite Límite Marca de Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativa fi* (Xihi % Hi % Xi*fi (Xi-Media)^2 económicas inferior LI superior LS clase (Xi) absoluta (fi) acumulada (Fi) relativa (hi) acumulada (Hi) Media)^2 0a1 0 1 0,5 7504 7504 0,367392901 37% 0,367392901 37% 3752 6,99 52463,9 2a5 2 5 3,5 11188 18692 0,547760098 55% 0,915152999 92% 39158 0,13 1416,83 6 a 10 6 10 8 1167 19859 0,057135863 6% 0,972288862 97% 9336 23,58 27517,1 11 a 20 11 20 15,5 406 20265 0,019877601 2% 0,992166463 99% 6293 152,67 61982,9 21 a 50 21 50 35,5 160 20425 0,007833537 1% 1 100% 5680 1046,90 167504, 20425 1 100% 64219 1230 310885

Además de la tabla de frecuencias para datos agrupados, se calcularon las medidas de tendencia central y de dispersión presentadas a continuación.

Tabla 2. Medidas de tendencia central y dispersión para los datos de compra-venta ferreterías, cerrajerías, vidrio y marqueterías

Medidas de tendencia Medidas de dispersión central Media 3,14 Varianza 15,22081569 Mediana 2,73 Desviación estándar 3,90138638 Moda 2,81

De acuerdo con los resultados obtenidos, es posible afirmar que la mayor cantidad de datos se encuentra entre los rangos 1 y 2, es decir, entre las unidades económicas del 1 al 5, con un porcentaje de 92%. Observando las frecuencias, también se puede concluir que solo el 1% de la población se encuentra en el rango de 21 a 50 unidades económicas; esto, puede indicar un comportamiento del tipo Pareto, donde los primeros rangos representan más del 80% de la población y los demás tienen un aporte mínimo. En cuanto a las medidas de tendencia central, la media de los datos es 3,14, lo que quiere decir, que se encuentra en el rango 2, donde las unidades económicas son de 2 a 5 y poseen la mayor cantidad de datos. Esto concuerda con los porcentajes obtenidos en la frecuencia relativa y los valores hallados tanto para la mediana como la moda, que indican que el valor medio de los datos (la mitad de los datos están por debajo y la otra mitad por encima) es 2,73 que se encuentra en el rango 2, al igual que la moda que toma un valor de 2,81. Las medidas de dispersión permiten determinar cuan alejados se encuentran los datos de la media, obteniendo una varianza de 15,22 y una desviación estándar o típica de 3,90; que son valores altos comparados con la media obtenida y significan que los datos poseen una alta dispersión y por ende no son muy cercanos a la media o muy homogéneos. 2. Ahora, haga lo mismo con el total de los datos (hay que sumar, por lo que, para agilizar el trabajo, podría copiar la tabla a una hoja de Excel). Nuevamente, describa la muestra con los datos obtenidos de la tabla de frecuencias y las respectivas medidas de tendencia central y de dispersión. Para desarrollar este literal, se suman las 65 categorías o áreas que se poseen por unidades económicas, para obtener una nueva variable bajo la cual hacer análisis estadístico y de frecuencias. El primer paso, es desarrollar la tabla de frecuencias para datos agrupados como se presenta a continuación. Tabla 3. Tabla de frecuencias para los datos totales TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS, DATOS TOTALES Unidades Límite Límite Marca de Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativa Rango hi % económicas inferior LI superior LS clase (Xi) absoluta (fi) acumulada (Fi) relativa (hi) acumulada (Hi) 1 0a1 0 1 0,5 408261 408261 0,55290101 55,3% 0,55290101 2 2a5 2 5 3,5 298014 706275 0,403595351 40,4% 0,956496361 3 6 a 10 6 10 8 20597 726872 0,027894171 2,8% 0,984390532 4 11 a 20 11 20 15,5 7881 734753 0,010673106 1,1% 0,995063638 5 21 a 50 21 50 35,5 3645 738398 0,004936362 0,5% 1 738398 1 100%

Hi %

Xi*fi

(Xi-Media)^2

55,3% 95,6% 98,4% 99,5% 100,0%

204130,5 1043049 164776 122155,5 129397,5 1663509

3,07 1,56 33,03 175,49 1105,37 1319

fi* (XiMedia)^2 1254392 463517,3 680310,7 1383010 4029082 7810312

Además de la tabla de frecuencias para datos agrupados, se calcularon las medidas de tendencia central y de dispersión presentadas a continuación.

Tabla 4. Medidas de tendencia central y dispersión para los datos totales

Medidas de tendencia Medidas de dispersión central Media 2,25 Varianza 10,57737403 Mediana 0,90 Desviación estándar 3,252287507 Moda 0,79

A partir de la tabla de frecuencias, y específicamente de las frecuencias relativas, es posible inferir que aproximadamente el 96% de los datos se encuentran en los primeros dos rangos de unidades económicas, siendo el primer rango (0 a 1) el que posee la mayoría de la población de datos con un 55%. También, es posible afirmar que los últimos tres rangos de unidades económicas solamente representan el 4% de los datos totales; esto cumpliendo un comportamiento del tipo Pareto. La media o promedio de los datos es de 2,25, lo cual indica que se encuentra dentro del rango de unidades económicas 2, es decir de 2 a 5; pero, la mediana y la moda se encuentran en el primer rango de unidades económicas con valores de 0,90 y 0,79 respectivamente, lo que indica que la mayoría de los datos se encuentran en esta primera categoría y esto concuerda con las frecuencias relativas observadas. Por su parte, las medidas de dispersión indican que los datos no son muy homogéneos pues como se puede observar la varianza y la desviación estándar o típica son muchos mayores a la media, indicando que los datos se mueven por encima y por debajo de la media, a distancias significativas. 3. ¿Existen diferencias notables entre los datos que escogió y los datos totales? Compárelos y describa las diferencias y/o similitudes entre ellas. Tenga en cuenta los datos de frecuencias relativas y las medidas de tendencia en esta pregunta. Tanto los datos de compra-venta de ferreterías, cerrajerías, vidrio y marqueterías, como los datos totales presentan similitudes como por ejemplo, en ambos casos, la mayoría de los datos se encuentran en los primeros dos rangos de unidades económicas con un 92% y un 96% respectivamente, lo cual indica que ambos muestran un comportamiento del tipo Pareto, donde la mayoría de los datos o representación se encuentra en pocos grupos (los primeros dos) y los demás tienen poca participación con porcentajes totales o frecuencias absolutas acumuladas de 9% y 4% respectivamente para los últimos tres rangos de unidades económicas. También, puede observarse que en ambas a partir del rango 3 de unidades económicas la cantidad de datos o las frecuencias absolutas, presentan un comportamiento decreciente. Otra similitud es que las medias son parecidas en ambos casos, con las dos ubicadas dentro del mismo rango de unidad económica (2 a 5) y cercanos a 2 y 3. Del mismo modo, las medidas de dispersión demuestran que para ambos conjuntos los datos poseen una alta dispersión, lo que indica que los datos no son completamente homogéneos y que están variando alrededor de la media. También es importante recalcar que se presentan algunas diferencias como que, para los datos de compraventa de ferreterías, cerrajerías, vidrio y marqueterías la mayoría de los datos se encuentran en el segundo rango de unidades económicas 2 a 5 con un 55% (frecuencia absoluta), mientras que para los datos totales la mayoría de los datos se encuentra en el primer rango 0 a 1 con un 55%. También se pueden notar diferencias

en las medidas de tendencia central de mediana y moda pues para el primer caso y al igual que la media se encuentran dentro del segundo rango de unidades económicas, mientras que para el segundo caso se encuentran en el primer rango. Finalmente, se puede concluir que las medidas de tendencia central tienen un comportamiento general que las ubica dentro de los rangos o grupos con más datos. 4. Escoja ahora otra unidad económica (cualquiera), construya la tabla de frecuencias y calcule medias de tendencia central y dispersión. Compare las dos series de datos y describa las diferencias y/o similitudes entre ellas. Tenga en cuenta los datos de frecuencias relativas y las medidas de tendencia en esta pregunta. Se elige el área de compra-venta de café trillado para dar respuesta a esta pregunta, y al igual que en los literales 1 y 2 se construye su tabla de frecuencias para datos agrupados y se calculan las medidas de tendencia central y dispersión como se presenta a continuación. Tabla 5. Tabla de frecuencias para los datos compra-venta de café trillado TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS (COMPRA-VENTA CAFÉ TRILLADO) Unidades Límite Límite Marca de Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativa Rango hi % económicas inferior LI superior LS clase (Xi) absoluta (fi) acumulada (Fi) relativa (hi) acumulada (Hi) 1 0a1 0 1 0,5 40 40 0,236686391 24% 0,236686391 2 2a5 2 5 3,5 84 124 0,49704142 50% 0,733727811 3 6 a 10 6 10 8 17 141 0,100591716 10% 0,834319527 4 11 a 20 11 20 15,5 15 156 0,088757396 9% 0,923076923 5 21 a 50 21 50 35,5 13 169 0,076923077 8% 1 169 1 100%

Hi % 24% 73% 83% 92% 100%

Xi*fi (Xi-Media)^2 20 294 136 232,5 461,5 1144

39,30 10,69 1,51 76,23 825,46 953

fi* (XiMedia)^2 1572,13 897,7811 25,75148 1143,395 10730,94 14370

Tabla 5. Medidas de tendencia central y dispersión para los datos compra-venta de café trillado

Medidas de tendencia Medidas de dispersión central Media 6,77 Varianza 85,0295858 Mediana 3,59 Desviación estándar 9,221148833 Moda 3,19

Este conjunto de datos presenta un comportamiento un poco más constante en el cual los datos se reparten de una forma más equitativa entre los diferentes rangos o unidades económicas, a excepción del 2 (2 a 5) que posee el 50% de los datos como se puede observar en la frecuencia relativa. En cuanto a las frecuencias absolutas se puede observar un comportamiento decreciente a partir del 3 rango de unidades económicas pero con disminuciones o diferencias pequeñas. En cuanto a las medidas de tendencia central, se puede observar que la media es de 6,77 ubicándose dentro del tercer rango de unidades económicas, mientras que la mediana y la moda se ubican en el segundo rango de unidades económicas indicando que la mayoría de los datos o al menos el 50% de estos se encuentra sobre 3,59 y el dato que más se repite será 3,19. Por otro lado, las medidas de dispersión indican que los datos presentan una variación significativa alrededor de la media. Al comparar este grupo de datos con el primero (compra-venta de ferreterías, cerrajerías, vidrio y marqueterías) es posible observar que ambos poseen la mayor cantidad de datos o mayor frecuencia relativa y absoluta en el segundo rango de unidades económicas y presentan el mismo comportamiento a partir del tercer rango, diferenciándose en que en el primer caso las diferencias entre las frecuencias es más significativa

o brusca mientras que en el segundo es más sutil. En cuanto a las medidas de tendencia central, el primer grupo de datos cumple la particularidad de que tanto media, mediana como moda tienen valores muy similares ubicándose dentro del mismo rango; mientras que para el café trillado se ubican en rangos distintos la media y la moda y mediana. Las medidas de dispersión presentan un comportamiento similar, siendo mayores para el café trillado. En cuanto a la comparación con el grupo de datos totales, se puede decir que hay diferencias en el comportamiento de las frecuencias en el primer y segundo rango; pues para los datos totales la mayor frecuencia se encuentra en el primer rango mientras que para el café trillado se encuentra en el segundo; pero, los grupos del 3 al 5 presentan el mismo comportamiento descendente, cumpliendo lo mismo que en la comparación con las ferreterías, es decir, que para los datos totales los cambios de frecuencias son más bruscos o grandes que para el café trillado. En cuando a las medidas de tendencia central, si bien son mayores para los datos del café trillado, presentan un comportamiento similar en cuanto que la media se encuentra en un rango o unidad económica superior a las medidas mediana y moda.

Referencias - Monroy, S. (2008). Estadística Descriptiva. Instituto Politécnico Nacional. México (pp 35-101). Recuperado de la base de datos E-libro. Link Biblioteca Iberoamericana: http://biblioteca.iberoamericana.edu.co/index.php/e-recursos/suscripcion - Romero, E. (2016). Estadística para todos. Ediciones Pirámide. España (pp 41-69). Recuperado de la base de datos E-Libro. Link Biblioteca Iberoamericana: http://biblioteca.iberoamericana.edu.co/index.php/e-recursos/suscripcion - Rodríguez, J., Pierdant, A., Rodriguez, C. Estadística para administración. Grupo Editorial Patria. 2014. México (pp 99-176). Recuperado de la base de datos E-Libro. Link Biblioteca Iberoamericana:http://biblioteca.iberoamericana.edu.co/index.php/e-recursos/suscripcion...


Similar Free PDFs