78581 Sol PEC 4 - Prácticas de asignatura Análisis Multivariante PDF

Title 78581 Sol PEC 4 - Prácticas de asignatura Análisis Multivariante
Author Sylvia Sánchez Du
Course Estadística Aplicada
Institution Universitat Oberta de Catalunya
Pages 6
File Size 400.2 KB
File Type PDF
Total Downloads 15
Total Views 166

Summary

Prácticas de asignatura Análisis Multivariante...


Description

Análisis Multivariante Curso 2018-19 / 1º semestre

Soluciones orientativas Prueba de evaluación continua 4. ANÁLISIS MULTIVARIANTE(II) Enunciado A partir de los datos que hay en el fichero "Datos_CasoPractico3.csv", en el que se basa el caso práctico de "El triángulo de las Bermudas", se pide que contestéis razonadamente las siguientes cuestiones. El nivel de significación α que debe considerar en toda la PEC es de 0,05. Pregunta 1: En el último ejercicio de la PEC3, vimos cuál era la "posición" que ocupaban los tres centros comerciales que configuraban el llamado "Triángulo de las Bermudas", según las valoraciones de los clientes de fuera del barrio de uno de ellos (Barcelona Glòries). Este posicionamiento lo analizamos a partir de la asociación que se hacía de cada característica a un centro comercial determinado. El gerente de Barcelona Glòries ya había podido sacar sus conclusiones, observando cuáles eran las características que se asociaban principalmente en su centro, y cuáles se asociaban a la competencia (Diagonal Mar y La Maquinista). De todos modos, quería profundizar un poco más en este análisis, y quería ver a qué grandes centros comerciales de Barcelona se parecía el suyo, tomando como punto de partida las valoraciones de los (sus) clientes de fuera del barrio de las 15 características (Car1 - Car15), obtenidas del cuestionario correspondiente (ver el apartado 5, "Imagen y posicionamiento del centro comercial"). Seleccionando sólo la submuestra de los clientes que usan el parking (que son de fuera del barrio), se obtienen los siguientes resultados agregados, para los 5 centros comerciales:

Car1 Car2 Car3 Car4 Car5 Car6 Car7 Car8 Car9 Car10 Car11 Car12 Car13 Car14 Car15

Glòries

Maquinista

55 46 38 56 56 42 60 63 57 42 40 30 49 40 55

98 109 107 95 117 99 101 112 105 90 93 131 96 119 102

Corte Inglés 38 38 31 21 38 40 51 34 20 35 54 26 32 7 31

Baricentro 78 54 41 55 52 63 49 54 71 51 45 49 57 34 50

Diagonal Mar 18 15 17 21 17 19 16 20 25 17 24 20 23 18 23

Para responder a esta pregunta, se pide: 1.1 Realizad un análisis clúster jerárquico, (enlace simple y distancia euclídea), y encontrad el correspondiente dendrograma. ¿Por qué centros comerciales están formados estos grupos? ¿A qué (o cuáles) centro(s) comercial(es) se parece más Barcelona Glòries? ¿Por qué? ¿A qué otro grupo se parece más el que contiene Barcelona Glòries? Razonad las respuestas. Nota: Para resolver este apartado debéis copiar la tabla anterior en un nuevo conjunto de datos de RCommander. Debéis tener en cuenta, sin embargo, que para hacer este análisis se debe copiar la tabla transpuesta: así, por ejemplo, la primera fila de la tabla debe ser la primera columna del fichero de trabajo de R-Commander. 1/6

Soluciones PEC4. ANÁLISIS MULTIVARIANTE(II)

> summary(as.factor(cutree(HClust.1, k = 3))) # Cluster Sizes 1 2 3 2 1 2 > by(model.matrix(~-1 + Car1 + Car2 + Car3 + Car4 + Car5 + Car6 + Car7 + Car8 + Car9 + Car10 + Car11 + Car12 + Car13 + Car14 + Car15, Cluster), as.factor(cutree(HClust.1, k = 3)), colMeans) # Cluster Centroids INDICES: 1 Car1 Car2 Car3 Car4 Car5 Car6 Car7 Car8 Car9 Car10 Car11 Car12 Car13 Car14 Car15 66.5 50.0 39.5 55.5 54.0 52.5 54.5 58.5 64.0 46.5 42.5 39.5 53.0 37.0 52.5 ------------------------------------------------------------------------------------------------INDICES: 2 Car1 Car2 Car3 Car4 Car5 Car6 Car7 Car8 Car9 Car10 Car11 Car12 Car13 Car14 Car15 98 109 107 95 117 99 101 112 105 90 93 131 96 119 102 ------------------------------------------------------------------------------------------------INDICES: 3 Car1 Car2 Car3 Car4 Car5 Car6 Car7 Car8 Car9 Car10 Car11 Car12 Car13 Car14 Car15 28.0 26.5 24.0 21.0 27.5 29.5 33.5 27.0 22.5 26.0 39.0 23.0 27.5 12.5 27.0

A partir de los resultados obtenidos, y sobre todo del dendrograma, podemos ver que se han formado tres grupos, los dos primeros más parecidos entre ellos que con el tercero: Grupo 1: Glòries (1) y Baricentro (4) Grupo 2: Corte Inglés (3) y Diagonal Mar (5) Grupo 3: Maquinista (2) Como se puede ver de esta agrupación, a partir de la información sobre las características, el centro comercial Barcelona Glòries se parece bastante a Baricentro. Por lo tanto, podemos considerar que las características analizadas son muy parecidas entre ambos centros.

2/6

Soluciones PEC4. ANÁLISIS MULTIVARIANTE(II) 1.2 ¿El resultado obtenido es coherente con el obtenido en el ejercicio 3 de la PEC 3? Razonad la respuesta. El resultado es bastante coherente con el de la PEC anterior dado que, como se puede ver aquí, los tres centros comerciales que configuran "El triángulo de las Bermudas" están en grupos diferentes, con ciertas disimilitudes. En el ejercicio 3 de la PEC3 vimos que los tres centros se situaban en diferentes zonas del gráfico, asociados a caraterísticas diferentes. 1.3 ¿En qué consiste el análisis clúster no jerárquico? ¿Se puede aplicar este análisis en nuestro caso? ¿Por qué? Razonad la respuesta Aunque desde el punto de vista teórico sí lo podríamos utilizar (ver Ficha 29), ya que la única diferencia con el jerárquico es que los grupos "se definen previamente ya sea a partir de los criterios considerados a la hora de definir las distancias, o bien porque cada una de las variables que consideramos se agrupa con el vecino más cercano", el no jerárquico se suele utilizar cuando tenemos muchas observaciones a clasificar y pocas variables.

Pregunta 2: El gerente quería volver a analizar el comportamiento de compra de sus clientes, y su relación con la valoración general del centro. Ahora que tenía mucha más información sobre los clientes de fuera del barrio, veía que había aspectos de su centro que debía considerarse con especial atención. Se había visto, por ejemplo, que la oferta de ocio tenía un papel muy importante (esta era una de las variables significativas en el análisis de regresión del ejercicio 1 de la PEC3). Esta oferta de ocio, sin embargo, era muy diversa en su centro, y quería segmentar sus clientes a través de esta oferta, teniendo en cuenta su grado de satisfacción general (SATISF_GEN). Se pide: 2.1 A partir de la base de datos “Datos_CasoPractico3.csv” crea un nuevo conjunto de datos de nombre DatosPreg2 recogiendo las observaciones de los que usan el parking (P14_M23R==”1”). Calculd la matriz de correlaciones entre las variables siguientes que recogen la satisfacción sobre diversos aspectos. Dad una interpretación a los resultados que obtengáis. P34_1 P34_2 P34_3 P34_4 P34_5

PRECIOS PROMOCIONES OFERTES VARIEDAD DE LAS TIENDAS CALIDAD DE LAS TIENDAS PARKING

> rcorr.adjust(DadesPreg2[,c("P34_1","P34_2","P34_3","P34_4","P34_5")], type="pearson", + use="complete") Pearson correlations: P34_1 P34_2 P34_3 P34_1 1.0000 0.5297 0.3833 P34_2 0.5297 1.0000 0.4631 P34_3 0.3833 0.4631 1.0000 P34_4 0.3336 0.4221 0.6816 P34_5 0.1528 0.3032 0.3027

P34_4 0.3336 0.4221 0.6816 1.0000 0.3307

P34_5 0.1528 0.3032 0.3027 0.3307 1.0000

Number of observations: 272 Pairwise two-sided P34_1 P34_2 P34_1...


Similar Free PDFs