Prueba de evaluación continua 4. ANÁLISIS MULTIVARIANTE(II) PDF

Title Prueba de evaluación continua 4. ANÁLISIS MULTIVARIANTE(II)
Course Análisis Multivariante
Institution Universitat Oberta de Catalunya
Pages 6
File Size 334.6 KB
File Type PDF
Total Downloads 18
Total Views 132

Summary

Solución PEC4...


Description

Análisis Multivariante Curso 2020-21 / 1º semestre

Soluciones orientativas Prueba de evaluación continua 4. ANÁLISIS MULTIVARIANTE(II) Enunciado A partir de los datos que hay en el fichero "Datos_CasoPractico3" en cualquiera de sus formatos (csv, xls, xlsx o RData), en el que se basa el caso práctico de "El triángulo de las Bermudas", se pide que contestéis razonadamente las siguientes cuestiones. El nivel de significación α que debe considerar en toda la PEC es de 0,05. Pregunta 1: En el último ejercicio de la PEC3, vimos cuál era la "posición" que ocupaban los tres centros comerciales que configuraban el llamado "Triángulo de las Bermudas", según las valoraciones de los clientes de fuera del barrio de uno de ellos (Barcelona Glòries). Este posicionamiento lo analizamos a partir de la asociación que se hacía de cada característica a un centro comercial determinado. El gerente de Barcelona Glòries ya había podido sacar sus conclusiones, observando cuáles eran las características que se asociaban principalmente en su centro, y cuáles se asociaban a la competencia (Diagonal Mar y La Maquinista). De todos modos, quería profundizar un poco más en este análisis, y quería ver a qué grandes centros comerciales de Barcelona se parecía el suyo, tomando como punto de partida las valoraciones de los (sus) clientes de fuera del barrio de las 15 características (Car1 - Car15), obtenidas del cuestionario correspondiente (ver el apartado 5, "Imagen y posicionamiento del centro comercial"). Seleccionando sólo la submuestra de los clientes que usan el parking (que son de fuera del barrio), se obtienen los siguientes resultados agregados, para los 5 centros comerciales:

Car1 Car2 Car3 Car4 Car5 Car6 Car7 Car8 Car9 Car10 Car11 Car12 Car13 Car14 Car15

Glòries

Maquinista

39 32 29 30 33 29 37 39 38 30 21 24 33 28 31

65 65 59 60 69 63 64 67 69 53 59 73 58 61 65

Corte Inglés 20 21 18 12 24 27 30 23 11 25 36 15 23 2 21

Baricentro 46 35 27 36 39 39 38 40 46 32 29 34 41 24 35

Diagonal Mar 13 9 8 14 11 11 11 14 15 10 18 14 14 10 12

Para responder a esta pregunta, se pide: 1.1 Realizad un análisis clúster jerárquico, (enlace simple y distancia euclídea), y encontrad el correspondiente dendrograma. ¿Por qué centros comerciales están formados estos grupos? ¿A qué (o cuáles) centro(s) comercial(es) se parece más Barcelona Glòries? ¿Por qué? ¿A qué otro grupo se parece más el que contiene Barcelona Glòries? Razonad las respuestas. Nota: Para resolver este apartado debéis copiar la tabla anterior en un nuevo conjunto de datos de RCommander. Debéis tener en cuenta, sin embargo, que para hacer este análisis se debe copiar la tabla

1/6

Soluciones PEC4. ANÁLISIS MULTIVARIANTE(II) transpuesta: así, por ejemplo, la primera fila de la tabla debe ser la primera columna del fichero de trabajo de R-Commander.

> summary(as.factor(cutree(HClust.2, k = 3))) # Cluster Sizes 1 2 3 2 1 2 > by(model.matrix(~-1 + Car1 + Car2 + Car3 + Car4 + Car5 + Car6 + Car7 + Car8 + Car9 + Car10 + Car11 + Car12 + Car13 + Car14 + Car15, cluster), + as.factor(cutree(HClust.2, k = 3)), colMeans) # Cluster Centroids INDICES: 1 Car1 Car2 Car3 Car4 Car5 Car6 Car7 Car8 Car9 Car10 Car11 Car12 Car13 Car14 Car15 42.5 33.5 28.0 33.0 36.0 34.0 37.5 39.5 42.0 31.0 25.0 29.0 37.0 26.0 33.0 ----------------------------------------------------------------------------------------------INDICES: 2 Car1 Car2 Car3 Car4 Car5 Car6 Car7 Car8 Car9 Car10 Car11 Car12 Car13 Car14 Car15 65 65 59 60 69 63 64 67 69 53 59 73 58 61 65 ----------------------------------------------------------------------------------------------INDICES: 3 Car1 Car2 Car3 Car4 Car5 Car6 Car7 Car8 Car9 Car10 Car11 Car12 Car13 Car14 Car15 16.5 15.0 13.0 13.0 17.5 19.0 20.5 18.5 13.0 17.5 27.0 14.5 18.5 6.0 16.5

A partir de los resultados obtenidos, y sobre todo del dendrograma, podemos ver que se han formado tres grupos, los dos primeros más parecidos entre ellos que con el tercero: Grupo 1: Glòries (1) y Baricentro (4) Grupo 2: Corte Inglés (3) y Diagonal Mar (5) Grupo 3: Maquinista (2) Como se puede ver de esta agrupación, a partir de la información sobre las características, el centro comercial Barcelona Glòries se parece bastante a Baricentro. Por lo tanto, podemos considerar que las características analizadas son muy parecidas entre ambos centros.

2/6

Soluciones PEC4. ANÁLISIS MULTIVARIANTE(II) 1.2 ¿El resultado obtenido es coherente con el obtenido en el ejercicio 3 de la PEC 3? Razonad la respuesta. El resultado es bastante coherente con el de la PEC anterior dado que, como se puede ver aquí, los tres centros comerciales que configuran "El triángulo de las Bermudas" están en grupos diferentes, con ciertas disimilitudes. En el ejercicio 3 de la PEC3 vimos que los tres centros se situaban en diferentes zonas del gráfico, asociados a caraterísticas diferentes. 1.3 ¿En qué consiste el análisis clúster no jerárquico? ¿Se puede aplicar este análisis en nuestro caso? ¿Por qué? Razonad la respuesta Aunque desde el punto de vista teórico sí lo podríamos utilizar (ver Ficha 29), ya que la única diferencia con el jerárquico es que los grupos "se definen previamente ya sea a partir de los criterios considerados a la hora de definir las distancias, o bien porque cada una de las variables que consideramos se agrupa con el vecino más cercano", el no jerárquico se suele utilizar cuando tenemos muchas observaciones a clasificar y pocas variables. Pregunta 2: El gerente quería volver a analizar el comportamiento de compra de sus clientes, y su relación con la valoración general del centro. Ahora que tenía mucha más información sobre los clientes de fuera del barrio, veía que había aspectos de su centro que debía considerarse con especial atención. Se había visto, por ejemplo, que la oferta de ocio tenía un papel muy importante (esta era una de las variables significativas en el análisis de regresión del ejercicio 1 de la PEC3). Esta oferta de ocio, sin embargo, era muy diversa en su centro, y quería segmentar sus clientes a través de esta oferta, teniendo en cuenta su grado de satisfacción general (SATISF_GEN). Se pide: 2.1 A partir de la base de datos “Datos_CasoPractico3” en cualquiera de sus formatos (csv, xls, xlsx o RData), crea un nuevo conjunto de datos de nombre DatosPreg2 recogiendo las observaciones de los que usan el parking (P14_M23R==”1”). Calculd la matriz de correlaciones entre las variables siguientes que recogen la satisfacción sobre diversos aspectos. Dad una interpretación a los resultados que obtengáis. P34_1 P34_2 P34_3 P34_4 P34_5

PRECIOS PROMOCIONES OFERTES VARIEDAD DE LAS TIENDAS CALIDAD DE LAS TIENDAS PARKING

Pearson correlations: P34_1 P34_2 P34_3 P34_1 1.0000 0.5768 0.4191 P34_2 0.5768 1.0000 0.5210 P34_3 0.4191 0.5210 1.0000 P34_4 0.4314 0.5729 0.7439 P34_5 0.1967 0.4262 0.3302

P34_4 0.4314 0.5729 0.7439 1.0000 0.3482

P34_5 0.1967 0.4262 0.3302 0.3482 1.0000

Number of observations: 118 Pairwise two-sided P34_1 P34_2 P34_1 F) P14_M18R 1 0.07 0.067 0.021 0.888 Residuals 13 41.67 3.205 > with(M7R_1, numSummary(SATISF_GEN, groups=P14_M18R, statistics=c("mean", "sd"))) mean sd data:n 0 6.833333 1.585923 12 1 7.000000 2.645751 3

5/6

Soluciones PEC4. ANÁLISIS MULTIVARIANTE(II) Y con la segunda submuestra, obtenemos el siguiente resultado:

> AnovaModel.10 summary(AnovaModel.10) Df Sum Sq Mean Sq F value Pr(>F) P14_M18R 1 1.92 1.921 1.749 0.189 Residuals 114 125.28 1.099 > with(M7R_0, numSummary(SATISF_GEN, groups=P14_M18R, statistics=c("mean", "sd"))) mean sd data:n 0 7.294643 1.045267 112 1 8.000000 1.154701 4

A partir de esta información, el gráfico del detector nos quedará de la siguiente manera:

En el enunciado nos preguntábamos si tenía o no sentido hacer esta segmentación a partir de los resultados obtenidos en el apartado anterior. La respuesta es que no mucho. La razón es que hemos considerado unas variables que no discriminaban, y eso no nos ha permitido segmentar mucho, obteniendo grupos no muy diferentes entre ellos (con grados de satisfacción muy similares).

6/6...


Similar Free PDFs