Propuesta Trabajo Colaborativo-Estadística II 2021-6 PDF

Title Propuesta Trabajo Colaborativo-Estadística II 2021-6
Author Ivis Milena Baldovino Ortega
Course Macroeconomía
Institution Politécnico Grancolombiano
Pages 4
File Size 323.3 KB
File Type PDF
Total Downloads 1
Total Views 25

Summary

Antes de comenzar:En el siguiente trabajo, cada estudiante debe contribuir a la solución de los ejercicios planteados, lo cual se debeevidenciar en una participación activa dentro de las semanas 3, 4 y 5. La evaluación de su participaciónsemanal y consolidados se basará en la siguiente rúbrica: Clic...


Description

Antes de comenzar:

En el siguiente trabajo, cada estudiante debe contribuir a la solución de los ejercicios planteados, lo cual se debe evidenciar en una participación activa dentro de las semanas 3, 4 y 5. La evaluación de su participación semanal y consolidados se basará en la siguiente rúbrica: Clic aquí

Tenga presente que para cada uno de los ejercicios debe ser explícito en la solución obtenida, es decir que son necesarios los procedimientos (Así estos sean fórmulas en Excel, se debe indicar cómo se usó y su resultado) y no se admiten archivos adjuntos, todo debe ser escrito directamente en el foro desarrollo del trabajo semanas 3, 4 y 5.

Cada semana el grupo presentará un CONSOLIDADO en el foro (no en documento ni adjuntos) con la solución a la actividad de la semana. Para ello uno de los participantes (escogido en común acuerdo por el grupo) publicará en el foro del trabajo colaborativo el título: CONSOLIDADO SEMANA ##, luego indicará los integrantes del grupo que participaron en la construcción de la propuesta (compañero que no haya participado en la semana no se puede incluir en el consolidado), y pondrá seguidamente la solución que consideren adecuada a cada interrogante. No deben colocar todas las soluciones dadas durante la semana sino la que el grupo considera debe ir en el consolidado.

Comencemos: CONTEXTO DEL PROBLEMA Se propone una base de datos en la cual aparece una muestra de 47.734 compras hechas en uno de los Black fridays que se realizan en Estados Unidos 1 y que pueden descargar del siguiente enlace: BlackFriday, a continuación la descripción de las variables: User_ID Product_ID Gender Age Occupation

Identificador único del comprador Identificador único del producto. Sexo del comprador Edad del comprador dividida en contenedores Ocupación del comprador.

1 Dagdoug, M. (10 de Julio de 2019). Black Friday Sales: Analysis an Prediction. Obtenido de Kaggle: https://www.kaggle.com/mehdidag/black-friday.

City_Category Stay_In_Current_City_Years Marital_Status Product_Category_1 Product_Category_2 Product_Category_3 Purchase

Lugar de residencia del comprador. Número de años en la ciudad actual. Estado civil del comprador (1 -> Casado, 0 -> Soltero) Categoría de producto de compra El producto puede pertenecer a otra categoría El producto puede pertenecer a otra categoría Valor de la compra en dólares

Se solicita a cada grupo de estudiantes realizar los desarrollos y consolidados de las actividades siguientes en las semanas indicadas.

1.

Actividad 1 (Semana 3)

En esta sección y en los ejercicios futuros asuman que los 47.734 datos corresponden a la población de clientes de la cadena de almacenes que obtuvo la información de la base de datos descargada. Se quiere estudiar cómo fueron las compras en esa jornada, por lo que se analizará principalmente la variable PURCHASE. a. Dado que la población es finita, estime cuál debe ser el tamaño de muestra si se desea un margen de error E = US$500, un nivel de confianza del 90% y se conoce por estudios anteriores que la desviación estándar poblacional es aproximadamente US$4986. b. Use Excel para extraer una muestra aleatoria del tamaño determinado en el ítem a. Deben explicar el paso a paso, fórmulas de Excel y adjuntar la muestra en formado .xlsx (Solo la muestra, el archivo no debe contener fórmulas ni procesos allí usados). c. De la variable PURCHASE, determine el valor de la media y la desviación estándar poblacionales y muestrales (tienen la población y una muestra). Explique brevemente quién es el estimador de quién allí. Además calcule la probabilidad de que la variable media muestral sea mayor o igual que el valor de la poblacional. d. Haga el histograma de la variable PURCHASE, calcule el sesgo, la curtosis e indique con ellos brevemente si la variable parece distribuirse de forma normal o no. (Use la población).

2.

Actividad 2 (Semana 4)

Use la muestra seleccionada en la actividad 1 para todos los desarrollos: a. Construya un intervalo de confianza al noventa por ciento para el promedio de la variable PURCHASE. Escriba la interpretación en el contexto del caso. Compruebe si la media poblacional cae en dicho intervalo. b. Construya un intervalo de confianza al noventa y cinco por ciento para la proporción de ventas superiores a US$5.000. Escriba la interpretación en el contexto del caso. Compruebe si la proporción poblacional está en este intervalo. c. Construya un intervalo de confianza al noventa por ciento para la diferencia de medias de las compras hechas por hombres y por mujeres. Escriba la interpretación en el contexto del caso.

3.

Actividad 3 (Semana 5)

Usando la muestra seleccionada en la actividad 1, conteste: a. Construya una prueba de hipótesis con un nivel de significancia de 0,05 para las ventas promedio, usando como hipótesis alternativa: “Miu es mayor a el valor real encontrado en la población (Actividad 1 ítem c.)". Justifique cada parte del proceso, al final dé su conclusión en el contexto del problema.

La hipótesis es nula, ya que el puntaje z de -35,09 se encuentra en el área de rechazo, el punto de corte es 1,645. cualquier puntaje z inferior a 1,645 será rechazado, dado que -35,09 es menor que 1,645, rechazamos la hipótesis nula

b. Construya una prueba de hipótesis con un nivel de significancia de 0,05 para concluir si hay diferencia entre las compras promedio de hombres y mujeres. Justifique cada parte del proceso, al final dé su conclusión en el contexto del problema. MARGEN DE ERROR MÁXIMO ADMITIDO TAMAÑO DE LA POBLACIÓN Tamaño para un nivel de confianza DESVIACIÓN MEDIA

0,05 47734 381,10091 4986 8922,14

Rechazamos la hipótesis nula y aceptamos la hipótesis alternativa. La puntuación z de 3.456,26 se encuentra dentro del área de rechazo, los 2 puntos de corte son y 0. Como el 3.456,26 está fuera de este intervalo, rechazamos la hipótesis nula, porque la puntuación z está fuera de su rango, se acepta la hipótesis alternativa....


Similar Free PDFs