Paso 4 Descripción de la Información PDF

Title Paso 4 Descripción de la Información
Course estadística descriptiva
Institution Universidad Nacional Abierta y a Distancia
Pages 14
File Size 353.7 KB
File Type PDF
Total Downloads 50
Total Views 215

Summary

Paso 4 Descripción de la InformaciónEdwin Ferley Romero Rodríguez Cód. 1.069.748 Grupo: 202107095_Carlos Eduardo Rueda TutorUniversidad Nacional Abierta y a Distancia Escuela de Ciencias Sociales, Artes y Humanidades Estadística Descriptiva Fusagasugá 2020IntroducciónEl siguiente trabajo trata de un...


Description

Paso 4 Descripción de la Información

Edwin Ferley Romero Rodríguez

Cód. 1.069.748.328 Grupo: 202107095_58

Carlos Eduardo Rueda Tutor

Universidad Nacional Abierta y a Distancia Escuela de Ciencias Sociales, Artes y Humanidades Estadística Descriptiva Fusagasugá 2020

Introducción

El siguiente trabajo trata de un análisis sobre Regresión y Correlación lineal con la finalidad de buscar o encontrar la relación que existe entre dos variables cuantitativas seleccionadas, teniendo en cuanta la información sobre la base de datos que hemos venido trabajando en actividades anteriores como las pruebas ICFES aplicadas a los estudiantes de grado once. Así mismo, se describen los conceptos relacionados con la temática trabajada: por ejemplo: ¿Qué es el coeficiente lineal y que nos ayuda a medir? O ¿qué es el Coeficiente de determinación R2? Entre otros conceptos importantes que nos permitieron apropiarnos de la temática, desarrollo de los ejercicios, la comprensión y el análisis de los mismos.

Justificación

El trabajo realizado se elaboró con el fin de detallar y relacionar las variables de una determinada problemática, en la cual se utilizaron Medidas Bivariantes. Esta actividad tiene como objetivo principal, determinar los conceptos de regresión y correlación lineal simple y múltiple. La aplicación de estos conceptos, son de gran importancia en el campo de investigación, facilita la conceptualización y las posibles decisiones que podemos tomar frente a las variables que estemos analizando.

Objetivos

Objetivo General: • Entender los conceptos básicos de Regresión y Correlación lineal.

Objetivos Específicos: • Presentar el cálculo de las Medidas Bivariantes de regresión lineal simple. • Determinar el grado de relación de las variables. • Identificar el modelo matemático que tiene una variable sobre la otra. • Diseñar diagramas de dispersión. • Comprender los tipos de asociación de variables.

Actividad 1. Mapa Mental Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y correlación. https://cdn3.mindmeister.com/es/1458412914/medidas-estad-sticas-bivariantes-de-regresi-ny-correlaci-n?fullscreen=1

Actividad 2. Definición de Conceptos. Diagrama de dispersión: Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio. A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de correlación, etc. El diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de correlación consiste en la representación gráfica de dos variables para

un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra. En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación. Correlación lineal simple: El concepto de relación o correlación se refiere al grado de variación conjunto existente entre dos o más variables. En este apartado nos vamos a centrar en el estudio de un tipo particular de relación llamada lineal y nos vamos limitar a considerar únicamente dos variables (simple). Coeficiente de determinación R2: Nos indica cuanto de la variación total en Y se debe a la variación en X, Su principal propósito es predecir futuros resultados o probar una hipótesis, es importante tener en cuenta que el resultado del coeficiente de terminación R2 oscila entre O y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. Por el contrario, si su resultado se encuentra más cerca de cero, menos ajustado estará al modelo y menos confiable será. Correlación positiva y correlación negativa. Correlación Positiva: Se habla de una correlación positiva cuando una relación entre una variable y otra es lineal y directa, de manera que un cambio en una variable predice el cambio en la otra variable. En ese caso, se dice que la correlación es positiva perfecta, es decir, ambas variables varían al mismo tiempo. Este tipo de correlación es directamente proporcional. Hay correlación positiva cuando las dos variables se correlacionan en sentido directo. Por lo que, a valores altos de una le corresponden valores altos de la otra e igualmente con los valores bajos.

Correlación Negativa: Se habla de una correlación negativa cuando la relación entre una variable y otra es opuesta o inversa, es decir, cuando una variable cambia, la otra se modifica hacia lo contrario. Entonces, cuando una posee variable valores altos, la otra posee valores bajos y mientras este valor esté más cerca de -1, más evidente será esta covariación. Se dice que hay correlación negativa perfecta cuando r = -1. Este tipo de correlación es inversamente proporcional. Entonces, hay correlación negativa cuando las dos variables se correlacionan en sentido inverso. ¿Qué es el coeficiente de correlación lineal y que nos ayuda a medir? En estadística, el coeficiente de correlación es una medida lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y continuas.

Actividad 3. Ejercicio práctico. En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a continuación; posterior a ello compartirá su elección en el foro del entorno de Aprendizaje Foro de discusión Unidad 3- Paso 4 Descripción de la Información. En cada ejercicio deberá responder los siguientes interrogantes: Estatura-Peso. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello

selecciona 10 niños y realiza las mediciones respectivas. A continuación, se presentan los resultados: Estatura (cm) 120 124 107 118 112 110 115 104 110 Peso (kg) 24 23 19 24 21 19 22 16 20 a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

peso 30

25

2

20

15

2

2 2

2

2

2

2

2

10

5

0 100

105

110

115

120

125

130

La relación lineal es positiva puesto que es ascendente, a mayor estatura mayor peso.

b. Encuentre el coeficiente de determinación y correlación. r= 0,73223824 Existe una correlación positiva directa entre las variables estatura, peso. R2= 0,53617285

c. Determine el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es Y= a+ b x Esto nos permite predecir el efecto de una variable sobre la otra, teniendo en cuenta que R2= 0,53617285 es cercano a 1 se puede determinar que es confiable d. Determine el grado de relación de las dos variables. r= 0,73223824 El grado de relación entre las variables es alta puesto que el valor es mayor que a 0.7

Actividad 4. Regresión y correlación Lineal Simple. -Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e identificar la variable dependiente e independiente. Las variables que pueden ser relacionadas en los datos de la prueba saber ICFES del grado 11 son el estrato familiar y horas diarias que labora, en este caso la variable independiente estrato familiar y variable dependiente son las horas diarias en que labora.

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las variables.

16 14 12 10 8 6 4 2 0

0

1

2

3

4

5

6

7

La relación lineal es negativa puesto que es descendente, a mayor estrato menores horas laborales. - Determine al coeficiente de determinación y de correlación de las dos variables. Interprete los resultados. r= -0,63693 Existe una correlación negativa media entre las variables estrato, horas laborales.

R2= 0.405678551

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático que permite predecir el efecto de una variable sobre la otra es Y= a+ b x Esto nos permite predecir el efecto de una variable sobre la otra, teniendo en cuenta que R2= 0.405678551 no es cercano a 1 se puede determinar que no es confiable.

- Determine el tipo de correlación de las dos variables. r= -0,63693 El grado de relación entre las variables es media puesto que el valor es menos que a -0.7 y mayor que -0.4. - Relacionar la información obtenida con el problema. La correlación es negativa puesto que cuando una variable aumenta la otra disminuye, esto se evidencia a medida que aumenta el estrato familiar, las horas laborales disminuyen.

Actividad 5. Regresión y correlación múltiple. A partir de la base de datos suministrada “Anexo 1- Pruebas SABER 11 - 160 estudiantes 2020 (16-4)”, cada estudiante, deberá: a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del estudio de investigación. Variable cuantitativa dependiente: horas laboradas al día. Variables cuantitativas independientes: horas dedicadas al internet, horas dedicadas a la lectura, libros consultados. b. Realizar el diagrama de dispersión de dichas variables.

60

50

40

30

20

10

0 0

2

4

6

8

10

12

14

c. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación. r= -0,37764

La correlación es negativa puesto que cuando una variable aumenta la otra disminuye, esto se evidencia a medida que aumenta las horas laborales, las horas de internet, de lectura y los libros consultados disminuyen.

d. Relacionar la información obtenida con el problema. A partir de la información obtenida podemos concluir que los estudiantes que deben trabajar varias horas al día, son los estudiantes que menos tienen acceso al internet, hacen menos lecturas y consultan menos libros, esto debido a que no cuentan con el tiempo suficiente a comparación con los estudiantes que no laboran.

16

Conclusiones

A través del desarrollo del presente trabajo puedo concluir que se logró aprender e identificar conceptos importantes como diagrama de dispersión, correlación lineal, coeficiente de determinación, correlación positiva y correlación negativa, los cuales son de suma importancia al momento de clasificar, elegir y manipular información, que nos permiten simplificar la interpretación de los datos recolectados de una forma rápida y eficiente. La metodología usada para llevar a cabo los ejercicios de la unidad tres, nos ayudaron a practicar los conceptos anteriormente mencionados, dándonos claridad sobre el manejo de la información a través de Excel. Con este trabajo pudimos aprender a comprobar la relación que existe entre una o más variables estadísticamente, ya que intuitivamente podemos deducir que una variable depende de otra, pero al realizarlo estadísticamente podremos darnos cuenta que tan confiable y que tanta relación existe entre ambas.

Referencias

-

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 – 158. Churchill, G.A. (2009).

-

Análisis de Correlación y de ---Regresión Simple. México City: Cengage Learning. Páginas 675 – 686....


Similar Free PDFs