Paso 3 analisis de la información PDF

Title Paso 3 analisis de la información
Course estadística descriptiva
Institution Universidad Nacional Abierta y a Distancia
Pages 21
File Size 605.6 KB
File Type PDF
Total Downloads 936
Total Views 1,000

Summary

Paso 3 Análisis de la Información Edwin Ferley Romero Rodríguez Cód. 1069748328 Grupo: 202107095_58 Carlos Eduardo Rueda Tutor Universidad Nacional Abierta y a Distancia Escuela de Ciencias Sociales, Artes y Humanidades Estadística Descriptiva Fusagasugá 2020 Introducción El presente trabajo trata s...


Description

Paso 3 Análisis de la Información

Edwin Ferley Romero Rodríguez Cód. 1069748328 Grupo: 202107095_58

Carlos Eduardo Rueda Tutor

Universidad Nacional Abierta y a Distancia Escuela de Ciencias Sociales, Artes y Humanidades Estadística Descriptiva Fusagasugá 2020

Introducción

El presente trabajo trata sobre las medidas estadísticas univariantes, las cuales se da solución al problema de estudio, resultados de las pruebas ICFES presentadas por 160 estudiantes de diferentes regiones del país. Para esto se utilizaron distintos análisis como tablas de frecuencia, graficas. Además determinar medidas de tendencia central y de dispersión. Así mismo comprender y entender la temática de la unidad 2 y plasmarlos en un mapa mental, para así mismo comprender y entender los conceptos básicos de las medidas estadísticas univariantes.

Objetivos

Objetivo General -

Conocer los conceptos de la estadística descriptiva para saber abordar de manera efectiva los resultados de las pruebas ICFES presentadas por 160 estudiantes de diferentes regiones del país de manera justificada.

Objetivos Específicos -

Conocer los resultados obtenidos para así saber cuál es la problemática de indicadores de las pruebas ICFES presentadas por 160 estudiantes.

-

Realizar las tablas de frecuenta y los diagramas para así saber interpretarlos.

-

Dar cumplimiento a la actividad propuesta por el docente.

Justificación

El análisis estadístico permite que los resultados de la problemática " resultados de las pruebas ICFES presentadas por 160 estudiantes de diferentes regiones del país" en el que pueda identificar de manera eficaz, a partir de proceso de cálculos en el cual se utilizan diversas metodologías como: tablas, histogramas y polígono de frecuencia, tipos de asimetría, acuartiles, deciles y saber interpretar los resultados obtenidos, teniendo corno finalidad el análisis que nos brinda para saber la problemática que lo conlleva.

Actividad 1. Mapa Mental

https://lucid.app/invitations/accept/70edfc2a-9eb6-4762-b67f-5adf997c5346 Adicionalmente presento mapa mental en imagen por si el link presenta falencias.

Actividad 2. Medidas Univariantes -variable Discreta. A partir de la base de datos: Anexo 1- Pruebas SABER 11 - 160 estudiantes 2020 (16-4), encontrada en el entorno de aprendizaje, cada estudiante deberá elegir una variable CUANTITATIVA DISCRETA distinta, manifestarlo en el foro y resolver los siguientes incisos: Variable cuantitativa discreta estrato familiar.

a. Tabla de frecuencia datos no agrupados. Diseñar una tabla de frecuencia para datos no agrupados de la variable elegida, a partir de ella elaborar un diagrama de barras y un diagrama de líneas o de puntos.

Estrato Familiar

Frecuencia Absoluta

0 1 2 3 4 5 6 Total

1 35 16 29 42 19 18 160

Frecuencia Relativa 1/160 35/160 16/160 29/160 42/160 19/160 18/160 160

Frecuencia porcentual (%) 0.63% 22% 10% 18% 26.3% 11.8% 11.3% 100%

Diagrama de barras.

Estrato Fam iliar 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%

Estrato 0

Diagrama de líneas.

Estrato 1

Estrato 2

Estrato 3

Estrato 4

Estrato 5

Estrato 6

Estrato Familiar

30.00% 25.00% 20.00% 15.00% 10.00% Estarto 6 Estrato 5 Estrato 4 Estrato 3 Estrato 2 Estrato 1 Estrato 0

5.00% 0.00%

b. Medidas de tendencia central y de Posición. Para la variable cuantitativa discreta elegida, cada estudiante deberá calcular las medidas de tendencia central (media, mediana, moda), medidas de posición: cuartiles, percentil 25 y 50, determinar el tipo de asimetría y curtosis, interpretar los resultados, sacar conclusiones de los parámetros hallados y asociarlos con la problemática: Identificación de los principales factores que influyen en los resultados de las pruebas SABER 11 en estudiantes de Instituciones públicas y privadas de Colombia”

Medidas de tendencia central: Media. La media aritmética se calcula sumando los datos (x1, x2, ..., xn) y dividiendo el resultado entre el número total de datos: x= x1 + x2 +...+ xn n

Media= 3,2

Mediana. Datos tomados de la tabla de frecuencia, estratos familiares. 1, 16, 18, 19, 29, 35, 42 Como el número de datos es 7, que corresponde a la frecuencia absoluta de los estratos familiares el valor del medio de estos datos es la mediana, puesto que deja tres valores por debajo y tres valores por encima. Este valor es 19, que corresponde al estrato 5.

Moda.

Estrato Familiar

Frecuencia Absoluta

0 1 2 3 4 5 6 Total

1 35 16 29 42 19 18 160

Frecuencia Relativa 1/160 35/160 16/160 29/160 42/160 19/160 18/160 160

Frecuencia porcentual (%) 0.63% 22% 10% 18% 26.3% 11.8% 11.3% 100%

La moda es el estrato 4, valor correspondiente a la mayor frecuencia que es 42.4.

Medidas de posición: Cuartiles, percentil 25 y 50.

Cuartiles. Datos tomados de la tabla de frecuencia, estratos familiares.

1, 16, 18, 19, 29, 35, 42 Cuartil 50= Q2= 19 1, 16, 18, 19, 29, 35, 42 Cuartil 25= Q1= 16

Percentiles. Datos tomados de la tabla de frecuencia, estratos familiares. P25= 25% de 7 = 0.25 * 7 = 1.75 aproximadamente 2 P50= 50% de 7 = 0.50 * 7 = 3.5 aproximadamente 4 P25= 2 1, 16, 18, 19, 29, 35, 42 Percentil de 25 es igual a 16. P50= 4 1, 16, 18, 19, 29, 35, 42 Percentil de 50 es igual a 19.

Determinar el tipo de asimetría y curtosis, interpretar los resultados. Ecuación para determinar asimetría.

El tipo de asimetría es asimétrica negativa puesto que el resultado es negativo -0.134 Ecuación para calcular el coeficiente de Curtosis.

La curtosis es laticurtica puesto que el resultado es negativo -0.146 Conclusión: En cuanto a medidas de tendencia central se puede concluir que la media calculada en los estratos socioeconómicos es de los estudiantes es de 3.2 teniendo en cuenta que los estratos van desde el cero al estrato seis, en los datos agrupados podemos calcular que la mediana es 19 que corresponde a la frecuencia absoluta que encontramos en la mitad de dos partes iguales, en cuanto a la moda podemos concluir que es 42 puesto que es la que más se repite y corresponde al estrato cuatro. En las medidas de posición encontramos que mediante las medidas cuartiles y percentiles podemos calcular los porcentajes mediante este ejercicio, arrojando como resultado que la medida cuartil corresponde a 16 que a su vez es del 25%, también encontramos como resultado 19 que a su vez corresponde al 50%. En la medida percentil encontramos los mismos resultados después de realizar los respectivos ejercicios. En los ejercicios de asimetría y curtosis se puede concluir que la asimetría es negativa puesto que el resultado es negativo, en cuento a la curtosis se puede determinar que es lacurtica dado que los resultados también son negativos.

c.

Medidas de Dispersión. Para la variable cuantitativa continúa elegida calcular: Rango, varianza, desviación típica o estándar, coeficiente de variación, posteriormente interpretar los resultados, sacar conclusiones de los parámetros hallados y asociarlos con la problemática: “Identificación de los principales factores que influyen en los resultados de las pruebas SABER 11 en estudiantes de Instituciones públicas y privadas de Colombia” Rango. Datos tomados de la tabla de frecuencia, estratos familiares.

1, 16, 18, 19, 29, 35, 42 El rango se calcula simplemente restando el valor mínimo del máximo del conjunto. 42 – 1 = 41 El rango es 41.

Varianza. 1, 16, 18, 19, 29, 35, 42 x=1+16+ 18 + 19 + 29+35 + 42 media 3.2 Formula de varianza.

La varianza es igual a 2.70.

Desviación típica o estándar. Formula de desviación estándar

Desviación estándar (σ): 1.64

Coeficiente de variación. Formula coeficiente de variación:

Coeficiente de variación es igual a 0.55

Conclusión: Del punto c podemos concluir que el rango es de 41 que corresponde a la frecuencia absoluta obtenida luego de restar el valor mínimo al valor máximo, en la varianza luego de obtener la media que corresponde a 3.2 y luego de hacer el ejercicio, se logró determinar que la varianza que hay entre los estratos socioeconómicos es de 2.70. Por otra parte la desviación estándar es del 1.64 y el valor del coeficiente de variación es de 0.55. Actividad 3. Medidas Univariantes -variable Continua

a. Tabla de frecuencia datos agrupados. Con la variable cuantitativa continúa elegida, diseñar una tabla de frecuencias para datos agrupados, identificando rango, número de intervalos, amplitud y a partir de ella elaborar un histograma de frecuencias y un polígono de frecuencias. Finalmente, interpretar los resultados de la tabla, de los gráficos estadísticos y asociarlos con la problemática: Identificación de los principales factores que influyen en los resultados de las pruebas SABER 11 en estudiantes de Instituciones públicas y privadas de Colombia” Para este ejercicio aplicare las horas que trabaja el estudiante por semana para realizar la tabla de frecuencia de datos agrupados con una variable cuantitativa continúa.

Tabla de frecuencia absoluta variable cuantitativa continúa Horas laboradas al día 0 2 5.5 8.5 10 12

Frecuencia Absoluta 91 9 20 15 13 5

Frecuencia Relativa 91/160 9/160 20/160 15/160 13/160 5/160

Frecuencia porcentual (%) 56.9% 5.7% 12.5% 9.4% 8.2% 3.2%

15.2 Total

7 160

7/160 160

4.4% 100%

Rango. El rango se calcula simplemente restando el valor mínimo del máximo del conjunto. 5, 7, 9, 13, 15, 20, 91 91-5= 86 El rango es de 86.

Número de intervalos. K= 1 + 3.322 log (160) K= 1 + 7.3220 = 8.32 aproximadamente 8 intervalos. Amplitud de intervalos. Es el rango dividido en el número de intervalos. 86/8= 10.75 Histograma de frecuencias.

Horas laboradas al dia 60.00% 50.00%

40.00% 30.00%

20.00% 10.00% 0.00% 0 Horas

2 Horas

5,5 Horas

8,5 Horas

10 Horas

12 Horas

15,2 Hotas

Polígono de frecuencia.

Horas laboradas al dia 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 0 Horas

2 Horas

5,5 Horas

8,5 Horas

b. Medidas de tendencia central y de Posición.

10 Horas

12 Horas

15,2 Hotas

Para la variable cuantitativa continúa elegida, cada estudiante deberá calcular las medidas de tendencia central (media, mediana, moda), medidas de posición: cuartiles, percentil 50 y 70, determinar el tipo de asimetría y curtosis e interpretar los resultados, sacar conclusiones de los parámetros hallados y asociarlos con la problemática: Identificación de los principales factores que influyen en los resultados de las pruebas SABER 11 en estudiantes de Instituciones públicas y privadas de Colombia”

Media La media aritmética se calcula sumando los datos (x1, x2, ..., xn) y dividiendo el resultado entre el número total de datos: x= x1 + x2 +...+ xn n

Media= 3,4

Mediana. Datos tomados de la tabla de frecuencia, estratos familiares. 5, 7, 9, 13, 15, 20, 91

Como el número de datos es 7, que corresponde a la frecuencia absoluta de las horas laboradas en el día el valor del medio de estos datos es la mediana, puesto que deja tres valores por debajo y tres valores por encima. Este valor es 13, que corresponde a 10 horas laborales.

Moda.

Horas laboradas al día 0 2 5.5 8.5 10 12 15.2 Total

Frecuencia Absoluta

Frecuencia Relativa

91 9 20 15 13 5 7 160

91/160 9/160 20/160 15/160 13/160 5/160 7/160 160

Frecuencia porcentual (%) 56.9% 5.7% 12.5% 9.4% 8.2% 3.2% 4.4% 100%

La moda es 0 horas laboradas, valor correspondiente a la mayor frecuencia que es 91. Medidas de posición: Cuartiles, percentil 50 y 70

Cuartiles. Datos tomados de la tabla de frecuencia, horas laborales. 5, 7, 9, 13, 15, 20, 91 Cuartil 50= Q2= 13 5, 7, 9, 13, 15, 20, 91 Cuartil 70= Q3= 15

Percentiles. Datos tomados de la tabla de frecuencia, horas laborales. P50= 50% de 7 = 0.50 * 7 = 3.5 aproximadamente 4 P70= 70% de 7 = 0.70 * 7 = 4.9 aproximadamente 5

P50= 4 5, 7, 9, 13, 15, 20, 91 Percentil de 50 es igual a 13. P70= 5 5, 7, 9, 13, 15, 20, 91

Percentil de 70 es igual a 15.

Determinar el tipo de asimetría y curtosis, interpretar los resultados. Ecuación para determinar asimetría.

El tipo de asimetría es asimétrica negativa puesto que el resultado es negativo -1,054

Ecuación para calcular el coeficiente de Curtosis.

La curtosis es laticurtica puesto que el resultado es negativo -0,015

Conclusión: En cuanto a medidas de tendencia central se puede concluir que la media calculada en las horas laborales por día de los estudiantes es de 3.4 teniendo en cuenta que las horas laborales van desde las cero horas hasta las 15.2 horas teniendo en cuenta que estas últimas afectan el rendimiento académico de los estudiantes, en los datos agrupados podemos calcular que la mediana es 13 que corresponde a la frecuencia absoluta que encontramos en la mitad de dos partes iguales, en cuanto a la moda podemos concluir que es 91 puesto que es la que más se repite y corresponde a las cero horas laboradas teniendo en cuenta que los estudiantes son menores de edad y no deberían de estar

ejerciendo labores. En las medidas de posición encontramos que mediante las medidas cuartiles y percentiles podemos calcular los porcentajes mediante este ejercicio, arrojando como resultado que la medida cuartil corresponde a 13 que a su vez es del 50%, también encontramos como resultado 15 que a su vez corresponde al 70%. En la medida percentil encontramos los mismos resultados después de realizar los respectivos ejercicios. En los ejercicios de asimetría y curtosis se puede concluir que la asimetría es negativa puesto que el resultado es negativo, en cuento a la curtosis se puede determinar que es lacurtica dado que los resultados también son negativos.

c. Medidas de Dispersión. Para la variable cuantitativa continúa elegida calcular: Rango, varianza, desviación típica o estándar, coeficiente de variación, posteriormente interpretar los resultados, sacar conclusiones de los parámetros hallados y asociarlos con la problemática: “Identificación de los principales factores que influyen en los resultados de las pruebas SABER 11 en estudiantes de Instituciones públicas y privadas de Colombia”

Rango. El rango se calcula simplemente restando el valor mínimo del máximo del conjunto. 5, 7, 9, 13, 15, 20, 91 91-5= 86 El rango es de 86.

Varianza.

5, 7, 9, 13, 15, 20, 91 media 3.4 Formula de varianza.

La varianza es igual a 21.61

Desviación típica o estándar. Formula de desviación estándar

Desviación estándar (σ): 4.64

Coeficiente de variación. Formula coeficiente de variación:

Coeficiente de variación es igual a 1,34 Conclusión: Del punto c podemos concluir que el rango es de 86 que corresponde a la frecuencia absoluta obtenida luego de restar el valor mínimo al valor máximo, en la varianza luego de obtener la media que corresponde a 3.4 y luego de hacer el ejercicio, se logró determinar que la varianza que hay entre las horas laborales diarias es de 21.61. Por otra parte la desviación estándar es del 4.64 y el valor del coeficiente de variación es de 1.34.

Conclusiones

La estadística descriptiva formula reglas y procedimientos para la presentación de una masa de datos en una forma más útil y significativa; establece normas para la representación gráfica de los datos y los convierte en una base importante para el análisis en casi todas las disciplinas académicas. A través de la estadística descriptiva, se adquieren habilidades y destrezas desarrollando y aplicándola en los diferentes campos donde nos desempeñamos y donde requerimos tomar decisiones relevantes; es claro que nos brinda herramientas para elaborar con cuidado la observación de hechos y fenómenos de la población en general, tomar una muestra y aplicar sus herramientas en la obtención de resultados, con el fin de fortalecer el quehacer profesional en la obtención, análisis y conclusiones de una investigación, que auxiliará contribuyendo con el manejo de información y ayudar en el contexto de la proyección social con el fin de lograr una mejor calidad de vida. "La estadística descriptiva es la organización y resumen de datos"

Referencias bibliográficas

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26 -42). Recuperado de https://link.gale.com/apps/doc/CX4052300007/GVRL? u=unad&sid=GVRL&xid=c94d9295 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A. (pp 17 – 60). Recuperado de https://link.gale.com/apps/doc/CX4052100008/GVRL? u=unad&sid=GVRL&xid=d49ed557 Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico Nacional. (pp 55-79). Recuperado de https://elibronet.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722

Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. (pp 107-137) Recuperado de https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/40413?page=1...


Similar Free PDFs