Proyecto Regresión Lineal Múltiple (Estadística Inferencial 2) PDF

Title Proyecto Regresión Lineal Múltiple (Estadística Inferencial 2)
Author Charles Dæilnyght
Course Estadística Inferencial 2
Institution Instituto Tecnológico de Tepic
Pages 20
File Size 1.5 MB
File Type PDF
Total Downloads 283
Total Views 516

Summary

Instituto Tecnológicode TepicIngeniería IndustrialEstadística Inferencial IIUnidad 1- Regresión Linealmúltiple4 BIntegrantes*Ávila Sandoval EmmanuelHumberto- 19400701.*Díaz Ceniceros Carlos Alberto- *Guzmán Flores Lauren Diann- *Hernández Ramírez ArellyYulianna- 19400758.*López Ceja Nadia Guadalupe-...


Description

Instituto Tecnológico de Tepic

Proyecto De Aplicación Ingeniería Industrial Estadística Inferencial II Unidad 1- Regresión Lineal múltiple 4B Integrantes *Ávila Sandoval Emmanuel Humberto- 19400701. *Díaz Ceniceros Carlos Alberto19400739. *Guzmán Flores Lauren DiannAnálisis Sobre Los Factores Que Influyen En El Aumento O Disminución De Peso De Las Personas Durante La Pandemia

19400756. *Hernández Ramírez Arelly Yulianna- 19400758. *López Ceja Nadia Guadalupe19400 Docente: M.A. Lucía Guadalupe Peraza Treviño.

Introducción En estadística, existen una variedad de métodos para emplear diferentes análisis de diversos tipos ya sea desde simples análisis donde se busque las frecuencias de un conjunto de datos, hasta diferentes estudios para el control de calidad en una organización, sin embargo, existen métodos de análisis de datos que nos permiten incluso validar estudios donde se necesitan saber si las variables que son estudiadas interfieren en dichos estudios, estos métodos son los análisis de regresión, los cuales nos permiten determinar si las variables que se manejan son importantes para un estudio determinado y en qué medida lo es, además de esto, estos análisis de regresión, se pueden usar en otras diferentes aéreas para un fin determinado fin, por ejemplo, es posible crear pronósticos de demanda con estos análisis, debido a que las regresiones, donde obtenemos una ecuación de regresión donde sí se sustituyen las variables, obtendremos el pronóstico con las medidas de las variables deseadas, claramente con un determinado rango de aceptación. 1. Planteamiento Antecedentes del problema: Vivimos en un país donde la obesidad es un tema crítico y un problema causal de varias enfermedades, que son la razón de la muerte de una gran cantidad de personas al año. Pero esto ha sido el tema regular durante bastantes años, en el último año (marzo 2020 – marzo 2021) ha ocurrido un suceso que alteró la vida como la conocíamos; la pandemia por el COVID-19 (Sars-cov-19). Tal acontecimiento ocasionó que la población en general entrase en estado de cuarentena. Gracias a otros estudios hechos con anterioridad se sabe que México ocupa los primeros lugares en obesidad, por malos hábitos que suelen tener las personas, si bien, tras la pandemia ha tenido como consecuencia que hayan más restricciones con respecto a realizar actividades cotidianas, como por ejemplo, los estudiantes estaban en constantes actividades por parte de la institución, actualmente ya es más sedentario, las personas al estar más tiempo en casa llegan a sufrir estrés lo cual puede tener aspectos negativos como la necesidad de estar comiendo a cada momento, cansancio físico y mental. La razón principal para realizar este estudio estadístico fue conocer las razones por las cuales las personas durante la pandemia tendieron a aumentar su peso, pudimos observar que las primeras prendas que se vendían en las tiendas eran tallas M, G, y Extra, lo cual indica que hubo una modificación en su dieta y actividades diarias. Otro objetivo que se persigue es conocer qué factores influyen en que las personas pierdan o ganen peso. Beneficios a futuro: Una vez obtenidos los resultados de la investigación, se podrá informar a las personas sobre los principales factores que han estado interviniendo para que suban de peso y puedan hacer una reflexión sobre qué hábitos deben corregir para cuidar más su salud física. Disminuir el índice de sobrepeso en la región, decreciendo la variedad de enfermedades relacionadas a este mismo. Nuestro principal objetivo de la investigación es determinar: ¿Qué factores influyen en el incremento/disminución del peso en las personas durante la pandemia?

2. Obtención de la información El método de obtención de datos utilizado en el presente estudio, fue muy sencillo y no presentó demasiada complicación ni costos económicos, fue mediante una serie de preguntas realizadas en “Google Forms” que nos facilitó hacer una encuesta a diferentes personas y poner obtener los datos necesarios para dicha investigación. Se decidió llevar a cabo esta estrategia ya que se les pidió a las personas que respondieran con honestidad a cada pregunta de la encuesta aplicada, al ser datos otorgados por las personas; se tiene la validez del mismo para determinar que los datos son auténticos, por consecuente, se trabaja con una problemática real. En la siguiente imagen se puede apreciar la evidencia de lo mencionado anteriormente: El tipo de muestreo utilizado se le denomina como: No probabilístico, debido a que son muestras de conveniencia o accidentales. Se forman con un grupo de individuos que se encuentran disponibles para participar en el estudio.

Posteriormente, se realizó la recolección de datos sobre las variables establecidas en el estudio, esto con el fin de poner tener las cifras correspondientes en tiempo real de las personas que nos ayudaron a contestarla, con esto nosotros ya pudimos tener tablas con los resultados que pudimos emplear en el análisis de las variables. Se tuvo un nivel de incertidumbre (por la forma de obtención de la información) con los datos y varias respuestas fueron borradas, esto dado a que una parte de las respuestas fueron a toma de poca profesionalidad y fuera del tema principal. Dándonos a entender que no deseaban contribuir con la investigación. Link De La Encuesta: https://docs.google.com/forms/d/1_RabyVaLGd85DTTlZ0c2McOkMJjCWq1B2RSsWBU17s/edit?usp=sharing

A continuación, se muestra la matriz de datos que se obtuvieron para el presente estudio: Peso Actual Horas De Ejercicio A La Semana Horas De Ocio A La Semana (Hrs) Verduras A La Semana Carne Roja A La Semana Carne Blanca A La Semana Frutas A La Semana 53 0 14 3 2 4 21 60 15 6 8 3 5 21 82 0 5 5 2 3 28 67 0 8 7 4 1 7 96 0 5 5 3 3 14 88 5 10 8 5 6 14 70 2 21 9 5 3 14 69 0 16 5 4 3 28 69 7 8 5 1 1 14 63 0 18 0 3 4 0 72 0 20 7 3 4 14 68 4 15 14 5 10 28 66 0 20 7 4 8 28 88 0 40 5 2 3 14 52 0 10 7 0 0 7 58 7 40 5 3 5 7 65 3 65 2 3 4 14 53 0 5 5 3 2 7 50 5 14 4 3 4 14 49 0 12 5 2 1 7 58 0 16 2 3 1 14 76 0 24 7 3 4 14 65 5 10 0 2 3 7 75 5 12 3 9 1 7 51 5 14 7 1 3 14 74 5 4 5 4 4 14 63 0 20 6 10 4 14 112 0 22 5 3 2 14 41 5 10 2 2 1 14 49 7 5 7 0 3 14 52 0 21 4 4 2 14 70 5 5 5 7 2 7 69 0 37 5 5 4 21 60 5 25 7 3 4 7 83 5 3 3 4 3 14 80 5 4 5 4 4 14 83 5 30 5 4 3 7 50 7 28 3 3 3 7 51 10 6 1 2 2 14 102 0 168 0 5 4 0 85 6 10 3 3 2 7 90 0 44 5 3 3 14 112 0 12 3 3 1 0 89 0 16 3 3 2 7 77 0 42 3 5 1 7 60 1 24 4 1 2 28 48 0 16 3 2 2 14 73 10 10 14 2 7 21 52 0 16 5 5 2 28 85 14 35 5 3 3 7 58 0 15 1 4 2 21 66 10 20 6 3 2 14

64 70 71 58 58 95 72 71 75 62 60 54 66 83 59 60 62 60 64 65 63.5 99 67 50 73 50 64 65 60 52 63 47 62 78 48 71 53 71 62.35 49 67 57 60 150 52 65 80 59 75 49 67 48.8 49 60 70

5 9 15 20 5 6 2 7 8 6 5 1 0 3 3 10 0 3 5 0 5.83 0 0 2 14 1 5 0 0 0 0 0 3 9 0 0 0 0 2 1 0 6.5 0 0 0 5 1 10 0 7 6 0 7 1.5 8

10 24 40 10 15 18 14 120 10 28 25 18 21 16 10 10 28 15 18 20 40 29 10 5 15 18 10 29 12 24 18 12 10 15 12 16 12 8 5 18 24 19 15 17 24 10 15 35 10 5 3 36 5 3 0

5 3 15 13 6 10 7 10 4 5 7 25 3 4 8 6 3 5 7 7 9 3 3 4 10 5 8 21 5 17 6 3 5 12 3 5 18 5 5 3 4 20 14 2 2 0 7 7 7 7 7 24 7 2 27

1 2 7 8 4 3 3 2 5 5 3 15 1 1 5 4 3 1 5 5 6 2 1 0 8 2 4 4 2 2 4 2 6 8 2 2 3 2 3 7 3 2 4 2 3 2 4 4 0 0 5 2 0 5 2

3 3 7 5 3 2 4 9 5 2 4 25 2 5 5 3 4 1 6 3 3 1 3 3 8 4 3 10 2 6 4 2 2 7 2 1 7 1 2 1 2 5 2 3 4 3 3 3 0 3 2 3 3 1 5

7 7 35 7 7 21 21 14 0 14 7 14 7 0 7 7 7 7 21 7 10.5 7 7 7 14 28 0 0 14 7 35 0 14 14 14 14 14 14 14 0 7 28 14 7 7 7 0 14 21 14 7 14 14 21 7

Lácteos A La Semana

Chatarra A La Semana 2 8 5 2 0 4 7 2 2 7 7 8 3 6 7 4 7 7 5 7 5 7 0 4 7 0 10 1 7 2 4 7 5 5 4 0 3 8 1 7 5 20 7 6 5 1 4 14 15 5 7 0

Horas De Sueño A La Semana (Hrs 5 1 2 8 0 1 0 2 0 7 0 4 0 5 3 4 3 3 7 4 5 1 1 4 1 0 5 2 4 0 3 2 3 2 1 0 3 4 0 7 1 3 2 1 2 1 1 10 4 3 3 2

3 7 6 7 8 6 6 7 6 7 6 5 6 7 8 10 7 7 6 5 5 5 7 8 7 5 6 7 10 6 5 9 7 8 8 5 7 6 7.5 6 8.5 8 6 8 7 8 6 8 6 9 8 7

Nivel De Estrés

Consumo De Agua A La Semana (L) 4 3 4 4 4 3 5 5 3 3 5 5 4 4 3 4 2 2 3 4 5 3 3 2 4 5 1 4 2 5 5 3 3 4 5 5 4 4 3 1 3 3 3 2 4 4 5 3 4 3 4 3

7 17.5 21 7 14 14 21 28 14 5.6 14 21 7 10.5 7 21 14 7 7 14 14 10.5 14 21 18.2 21 7 7 21 14 7 14 21 14 21 21 7 7 14 14 21 14 14 28 14 14 21 14 7 14 17.5 21

Edad

Peso A Inicios De Pandemia 19 20 20 19 21 19 19 19 17 20 19 20 21 19 20 15 17 20 21 19 20 21 19 23 20 25 19 26 16 19 19 21 17 19 20 25 20 22 22 19 19 19 21 22 16 19 19 20 17 20 20 20

50 55 75 65 78 83 65 68 75 60 70 63 64 80 59 51 90 51 51 52 61 75 63 69 50.5 80 60 110 48 55 48 64 61 58 85 80 80 55 58 90 89 80 106 87 65 55 46 75 51 95 53 72

7 5 10 2 7 5 10 2 4 7 5 2 3 3 10 7 13 2 5 3 15 5 4 1 7 2 4 14 7 2 8 10 7 3 4 7 1 7 2 1 5 0 7 3 14 0 7 0 0 2 2 1 2 7 7

1 2 5 1 3 4 1 4 5 1 2 0 1 0 5 2 1 3 4 1 0.5 7 5 0 3 3 2 7 4 3 5 10 2 2 1 10 3 10 2 7 2 1 0 2 4 1 1 2 0 0 3 1 0 1 0

Datos Estadísticos De Peso Inicial: 67.1276 S= 16.2653

8 8 8 7 7 8 3 12 7 8 8 8 6 8 8 7 7 7 6 6 7 8 9 8 7 7 2 7 8 7 7 10 5 8 6 8 7 8 8 6 8 8 6 8 9 7 7 9 5 6 8 8 6 6 6

3 5 1 4 4 5 4 4 4 1 4 1 3 4 4 3 4 2 3 3 3 5 5 3 4 5 2 4 3 3 5 3 4 2 5 2 5 2 3 5 4 2 5 4 4 3 4 5 5 5 4 2 5 2 5

10.5 35 10.5 21 14 7 21 14 10.5 21 14 14 7 14 10.5 21 10.5 14 14 7 7 14 17.5 7 21 21 14 28 17.5 4.809 7 7 10.5 14 21 28 7 28 21 14 21 14 7 10.5 14 14 21 21 7 14 14 5.6 14 17.5 14

19 19 21 17 20 21 22 19 19 19 19 21 17 19 20 19 19 19 15 18 19 18 21 18 22 20 17 21 21 17 18 19 19 22 19 21 18 21 21 22 19 20 20 19 23 19 20 20 19 19 20 19 19 19 19

Datos Estadísticos De Peso Actual: 65.9874 S= 14.9850

64 65 70 69 50 90 76 75 68 60 58 53 64 90 58 65 60 57 60 62 60 95 63 50 82 49 60 65 58 50 56 44 59 81 46 70 52 70 60.35 47 75 60 56 128 50.8 63 89 63 69 55 62 50 55 56 68

3. Resultados Definición de variables Variable de respuesta (y): el peso actual de la persona. Variables independientes: X1 = Edad X2 = Peso a inicios de pandemia X3 = Horas De Ejercicio A La Semana X4 = Horas De Ocio A La Semana (Hrs) X5 = Verduras A La Semana X6 = Carne Roja A La Semana X7 = Carne Blanca A La Semana X8 = Frutas A La Semana X9 = Lácteos A La Semana X10 = Chatarra A La Semana X11 = Horas De Sueño A La Semana (Hrs) X12 = Nivel De Estrés X13 = Consumo De Agua A La Semana (L) Modelo de regresión Primeramente, se realizó un análisis de regresión múltiple con un nivel de confianza del 95% para determinar el modelo estadístico de los datos obtenidos, el cual se muestra a continuación. Alta significancia (1%) 

Peso a inicios de pandemia



Horas de ejercicio a la semana

Significancia (5%) 

Carne Roja a la semana

Sin significancia para el modelo (0%)          

Edad Horas de ocio a la semana (hrs) Carne Blanca a la semana Frutas a la semana Lácteos a la semana Chatarra a la semana Horas de sueño a la semana Nivel de estrés Consumo de agua a la semana Verduras a la semana

Descripción Del Modelo De Regresión:



Indica que el peso actual se verá incrementado en 1.0369 unidades cuando se incremente un kilo al peso a inicios de pandemia.



Habrá un decremento de 0.556 unidades cuando se aumente en una unidad la hora de ejercicio a la semana.



Existirá otro decremento de 0.0015 unidades cuando se aumente una hora de ocio la semana.



Se tendrá otro decremento de las 0.040 unidades cuando es aumenta en una unidad el consumo de verduras a la semana.



Habrá un incremento de 0.683 unidades por cada vez que se consuma carne roja la semana.



Se tendrá un decremento de 0.195 unidades por cada vez que se consuma carne blanca a la semana.



Existirá aumento de 0.0597 unidades por cada unidad de fruta que se consuma la semana.



Se tendrá aumento de 0.004 unidades cuando se aumente en una unidad los lácteos a la semana.



Habrá un aumento de 0.102 unidades por cada unidad de chatarra que se consuma a la semana.



Se añadirá un incremento de 0.321 unidades por cada hora de sueño a la semana.



Un incremento de 0.545 unidades cuando se incremente el nivel de estrés en uno.



Habrá un decremento de 0.0862 unidades cuando se aumente en uno, los litros del consumo de agua a la semana.

Desglose de coeficientes:

1. Edad: Se hace referencia a los años de vida que cada individuo encuestado tenga al momento de haber participado en el estudio. Teniendo una hipótesis nula de que la edad no influye en el peso actual, mientras que la hipótesis alternativa indica que la edad sí influye. Con estos datos podemos analizar el valor p o p-value es mayor al 5%, por lo que aceptamos la hipótesis nula y rechazamos la alternativa, para indicar que la edad no influye en el peso actual. Existe evidencia estadística para indicar que el intervalo para la edad va desde -0.9806 a 0.3371 con un nivel de confianza del 95%. Por lo que esta variable es no difiere de cero y no influye en el modelo.

2. Peso a inicios de pandemia: Hace referencia al peso aproximado o exacto que el individuo tenía al iniciar la pandemia del SARS COV 19. Teniendo una hipótesis nula de que el peso a inicios de pandemia no influye en el peso actual, mientras que la hipótesis alternativa indica que el peso a inicios de pandemia sí influye. Con estos datos podemos analizar el valor p o p-value es menor al 1%, por lo que rechazamos la hipótesis nula y aceptamos la alternativa para indicar que el peso a inicios de pandemia sí influye en el peso actual. Existe evidencia estadística para indicar que el intervalo para el valor del peso a inicios de pandemia va de 0.9567 a 1.1171 con un nivel de confianza del 95%. Por lo que esta variable es creciente e influye en modelo

3. Horas de ejercicio a la semana: Se refiere a la cantidad en horas de actividad física realizada por el participante en un periodo promedio de 7 días. Teniendo una hipótesis nula de que las horas de ejercicio a la semana no influyen en el peso actual, mientras que la hipótesis alternativa indica que las horas de ejercicio a la semana sí influyen. Con estos datos podemos analizar el valor p o p-value es menor al 5% y mayor a 1%, por lo que rechazamos la hipótesis nula y aceptamos la alternativa para indicar que las horas de ejercicio a la semana sí influye en el peso actual. Existe evidencia estadística para indicar que el intervalo para las horas de ejercicio a la semana va de -0.8400 a -0.2715 con un nivel de confianza del 95%. Por lo que esta variable es decreciente e influye en modelo.

4. Horas de ocio a la semana (hrs): Se refiere al tiempo que el individuo se encuentra en estado sedentario. Teniendo una hipótesis nula de que las horas de ocio a la semana no influyen en el peso actual, mientras que la hipótesis alternativa indica que las horas de ocio a la semana sí influyen. Con estos datos podemos analizar el valor p o p-value es mayor al 5%, por lo que aceptamos la hipótesis nula y rechazamos la alternativa, para indicar que las horas de ocio a la semana no influyen en el peso actual. Existe evidencia estadística para indicar que el intervalo para las horas de ocio a la semana va desde -0.0614 a 0.0583 con un nivel de confianza del 95%. Por lo que esta variable es no difiere de cero y no influye en el modelo.

5. Carne blanca a la semana: Significa la cantidad de veces que en promedio se consumen comidas basadas en carne blanca cada 7 días. Teniendo una hipótesis nula de que el consumo de carne blanca a la semana no influye en el peso actual, mientras que la hipótesis alternativa indica que el consumo de carne blanca a la semana sí influye. Con estos datos podemos analizar el valor p o p-value es mayor al 5%, por lo que aceptamos la hipótesis nula y rechazamos la alternativa, para indicar que el consumo de carne blanca a la semana no influye en el peso actual. Existe evidencia estadística para indicar que el intervalo para el consumo de carne blanca a la semana va desde -0.7437 a 0.3538 con un nivel de confianza del 95%. Por lo que esta variable es no difiere de cero y no influye en el modelo.

6. Carne Roja a la semana: Significa la cantidad de veces que en promedio se consumen comidas basadas en carne roja cada 7 días. Teniendo una hipótesis nula de que el consumo de carne roja a la semana no influye en el peso actual, mientras que la hipótesis alternativa indica que el consumo de carne roja a la semana sí influye. Con estos datos podemos analizar el valor p o p-value es menor al 5% y mayor a 1%, por lo que rechazamos la hipótesis nula y aceptamos la alternativa para indicar que el consumo de carne roja a la semana sí influye en el peso actual Existe evidencia estadística para indicar que el intervalo para el consumo de carne roja a la semana va de 0.0753 a 1. 2916 con un nivel de confianza del 95%. Por lo que esta variable es creciente e influye en modelo.

7. Verduras a la semana: Significa la cantidad de veces que en promedio se consumen comidas basadas en verduras cada 7 días. Teniendo una hipótesis nula de que el consumo de verduras a la semana no influye en el peso actual, mientras que la hipótesis alternativa indica que el consumo de verduras a la semana sí influye. Con estos datos podemos analizar el valor p o p-value es mayor al 5%, por lo que aceptamos la hipótesis nula y rechazamos la alternativa, para indicar que el consumo de verduras a la semana no influye en el peso actual. Existe evidencia estadística para indicar que el intervalo para el consumo de verduras a la semana va desde -0.3176 a 0.2382 con un nivel de confianza del 95%. Por lo que esta variable es no difiere de cero y no influye en el modelo.

8. Frutas a la semana: Se refiere a la cantidad de frutas que se consumen entre toda la semana (Principalmente frutas de tamaño considerable) Teniendo una hipótesis nula de que el consumo de frutas a la semana no influye en el peso actual, mientras que la hipótesis alternativa indica que el consumo de frutas a la semana sí influye. Con estos datos podemos analizar el valor p o p-value es mayor al 5%, por lo que aceptamos la hipótesis nula y rechazamos la alternativa, para indicar que el consumo de frutas a la semana no influye en el peso actual. Existe evidencia estadística para indicar que el intervalo para el consumo de frutas a la semana va desde -0.0865 a 0.2060, con un nivel de confianza del 95%. Por lo que esta variable es no difiere de cero y no influye en el modelo.

9. Lácteos a la semana: Significa la cantidad de veces que en promedio se consumen comidas basadas en leche y derivados cada 7 días. Teniendo una hipótesis nula de que el consumo de lácteos a la semana no influye en el peso actual, mientras que la hipótesis alternativa indica que el consumo de lácteos a la semana sí influye. Con estos datos podemos analizar el valor p o p-value es mayor al 5%, por lo que aceptamos la hipótesis nula y rechazamos la alternativa, para indicar que el consumo de lácteos a la semana no influye en el peso actual. Existe evidencia estadística para indicar que el intervalo para la el consumo de lácteos a la semana va desde -0.3090 a 0.3164 con un nivel de confianza del 95%. Por lo que esta variable es no difiere de cero y no influye en el modelo.

10. Chatarra a la semana: Se refiere a la cantidad de frituras, galletas, y demás productos con alta cantidad de azucares y grasas en general. Teniendo una hipótesis nula de que el consumo de comida chatarra a la semana no influye en el peso actual, mientras que la hipótesis alternativa indica que el consumo de comida chatarra a la semana sí influye. Con estos datos podemos analizar el valor p o p-value es mayor al 5%, por lo que aceptamos la hipótesis nula y rechazamos la alternativa, para indicar que el consumo de comida chatarra a la semana no influye en el peso actual. Existe evidencia estadística par...


Similar Free PDFs