Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Análisis Multivariante Curso 2022-23 / 1º semestre 1/8 Nombre y apellidos del estudiante Prueba de evaluación continua 4. ANÁLISIS MULTIVARIANTE(II) Criterios de evaluación Las preguntas y los problemas tienen que estar desarrollados y razonados. No se considerará correcta ninguna respuesta no argumentada. Cada pregunta vale ½ del total de puntos. Formato y fecha de entrega Las pruebas de evaluación continuada se tienen que entregar en el buzón específico de Entrega de actividades que se encuentra en el apartado Evaluación del aula en un único fichero en formato PDF. El último día para entregar esta actividad es el próximo 18 de diciembre de 2022. Enunciado A partir de los datos que hay en el fichero “Datos_CasoPractico1.csv”, en el que se basa el caso práctico de “El triángulo de las Bermudas”, se pide que contestéis razonadamente las siguientes cuestiones. El nivel de significación α que se debe de considerar en toda la PEC es de 0,05. Pregunta 1: En el último ejercicio de la PEC3, vimos cuál era la “posición” que ocupaban los tres centros comerciales que configuraban el llamado “Triángulo de las Bermudas”, según las valoraciones de los clientes de fuera del barrio de uno de ellos (Barcelona Glòries). Este posicionamiento lo analizamos a partir de la asociación que se hacía de cada característica a un centro comercial determinado. El gerente de Barcelona Glòries ya había podido sacar sus conclusiones, observando cuáles eran las características que se asociaban principalmente en su centro, y cuáles se asociaban a la competencia (Diagonal Mar y La Maquinista). De todos modos, quería profundizar un poco más en este análisis, y quería ver a qué grandes centros comerciales de Barcelona se parecía el suyo, tomando como punto de partida las valoraciones de los (sus) clientes de fuera del barrio de las 15 características (Car1 - Car15), obtenidas del cuestionario correspondiente (ver el apartado 5, “Imagen y posicionamiento del centro comercial”). Seleccionando sólo la submuestra de los clientes que usan el parking (que son de fuera del barrio), se obtienen los siguientes resultados agregados, para los 5 centros comerciales: Glòries Maquinista Corte Inglés Baricentro Diagonal Mar Car1 45 78 29 66 15 Car2 37 95 26 42 13 Car3 31 91 25 32 15 Car4 48 80 16 44 17 Car5 47 98 29 41 14 Car6 33 83 30 53 16 Car7 50 84 37 38 13 Car8 53 91 25 42 16 Car9 45 83 17 59 20 Car10 37 77 23 40 14 Car11 35 77 40 36 18 Car12 25 112 20 38 16 Car13 40 80 24 44 19 Car14 32 101 6 23 13 Car15 48 84 22 39 20 PEC4. ANÁLISIS MULTIVARIANTE(II) 2/8 Para responder a esta pregunta, se pide: 1.1 Realiza un análisis clúster jerárquico (enlace simple y distancia euclídea) y encuentra el correspondiente dendrograma. ¿Cuántos grupos observamos? ¿Por qué centros comerciales están formados estos grupos? ¿A qué (o cuáles) centro(s) comercial(es) se parece más Corte Inglés? ¿Por qué? ¿A qué otro grupo se parece más el que contiene Corte Inglés? Razonad las respuestas. Nota: Para resolver este apartado debéis copiar la tabla anterior en un nuevo conjunto de datos de R- Commander. Debéis tener en cuenta, sin embargo, que para hacer este análisis se debe copiar la tabla transpuesta: así, por ejemplo, la primera fila de la tabla debe ser la primera columna del fichero de trabajo de R-Commander. Respuesta: CentrosComerciales <- hclust(dist(model.matrix(~-1 + Car1+Car2+Car3+Car4+Car5+Car6+Car7+Car8+Car9+Car10+Car11+Car12+Car13+Car14+Car15, Cluster)) + , method= “single”) plot(CentrosComerciales, main= “Cluster Dendrogram for Solution CentrosComerciales”, xlab= “Observation Number in Data Set Cluster”, sub=”Method=single; Distance=euclidian”) Interpretación: Observamos tres grupos en el dendograma conformados por Clúster 1: Glories y Baricentro, Clúster 2: Corte Ingles y Diagonal Mar por último Clúster 3: Maquinista. El centro comercial Corte ingles queda equiparado al Diagonal del mar, por estar ambos centros comerciales formando el mismo clúster. De igual forma este clúster se asemeja al formado por Glories y Baricentro, por estar ambos clúster en el mismo nivel. Se observa que el centro comercial que tiene características totalmente distintas a los demás en el Maquinista que en si mismo forma un Clúster M a q u in is ta G lo ri e s B a ri c e n tr o C o rt e I n g le s D ia g o n a l M a r 0 5 0 1 0 0 1 5 0 Cluster Dendrogram for Solution CentrosComerciales Method=single; Distance=euclidian Observation Number in Data Set Cluster H e ig h t PEC4. ANÁLISIS MULTIVARIANTE(II) 3/8 1.2 ¿El resultado obtenido es coherente con el obtenido en el ejercicio 3 de la PEC 3? Razonad la respuesta. Respuesta: En el ejercicio 3 del PEC 3 en el análisis de factores teníamos que el centro comercial Maquinista, Diagonal Mar y Glories tenía características distintas situándose en distintos sectores del mapa como se observa. Una situación similar la tenemos en el grafico de dendograma donde los tres pertenecen a distintos clúster. Por lo tanto existe total coherencia 1.3 ¿En qué consiste el análisis clúster no jerárquico? ¿Se puede aplicar este análisis en nuestro caso? ¿Por qué? Razonad la respuesta. Respuesta: Análisis Clúster No Jerárquicos (Partitioning Clúster): Los métodos no jerárquicos categorizan los elementos según un número de clúster dado. Necesitan que el número de particiones esté fijado a priori. Este tipo de análisis no seria recomendable dado que el gerente desea saber cuales centros comerciales se parecen al suyo y al fijar el número de clúster estaría a priori estaría obligando la agrupación en un numero determinado que no resultaría provechoso para saber cual centro comercial se parece al suyo. Glories Maquinista Diagonal Mar C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11C12 C13 C14 C15 -0.1 0.0 0.1 -0.2 -0.1 0.0 0.1 0.2 Dim 1 (80.12%) D im 2 ( 1 9 .8 8 % ) CA factor map PEC4. ANÁLISIS MULTIVARIANTE(II) 4/8 Pregunta 2: El gerente quería volver a analizar el comportamiento de compra de sus clientes, y su relación con la valoración general del centro. Ahora que tenía mucha más información sobre los clientes de fuera del barrio, veía que había aspectos de su centro que debían considerarse con especial atención. Había visto, por ejemplo, que la oferta de ocio tenía un papel muy importante (esta era una de las variables significativas en el análisis de regresión del ejercicio 1 de la PEC3). Esta oferta de ocio, sin embargo, era muy diversa en su centro, y quería segmentar sus clientes a través de esta oferta, teniendo en cuenta su grado de satisfacción general (SATISF_GEN). Se pide: 2.1 A partir de la base de datos “Datos_CasoPractico1.csv”, cread un nuevo conjunto de datos de nombre DatosPreg2 recogiendo las observaciones de los que usan el parking (P14_M23R==”1”). Calculad la matriz de correlaciones entre las variables siguientes que recogen la satisfacción sobre diversos aspectos. Dad una interpretación a los resultados que obtengáis. P34_1 PRECIOS P34_2 PROMOCIONES OFERTES P34_3 VARIEDAD DE LAS TIENDAS P34_4 CALIDAD DE LAS TIENDAS P34_5 PARKING Respuesta: Interpretacion: Con los coeficientes obtenidos podemos establecer las siguientes correlaciones significativas: entre las variables ( P34_3 y P34_4) es alta. Para las variables ( P34_1 y P34_2); ( P34_1 y P34_3) y ( P34_2 y P34_3) moderada. Para las variables ( P34_1 y P34_4); ( P34_2 y P34_4); ( P34_2 y P34_5) y ( P34_3 y P34_5); es baja. Todas las correlaciones fueron positivas dando lugar a una relación directamente proporcional en los niveles antes mencionados. Para el par ( P34_1 y P34_5) la correlación fue muy baja y no significativa. PEC4. ANÁLISIS MULTIVARIANTE(II) 5/82.2 A partir de las siguientes variables dicotómicas que dan información sobre si los clientes usan o no el servicio: P14_M2R CAF REST FFOOD P14_M7R HOGAR DECORACIÓN P14_M8R CINES P14_M14 SERVICIOS LÚDICOS Se pide que hagáis un análisis ANOVA de cada una de ellas respecto a la variable satisfacción general (SATISF_GEN). ¿Cuál de estas 4 variables discrimina más? ¿Por qué? Nota: Previamente hay que crear las variables P14_M2R, P14_M7R, P14_M8R, P14_M14R como factores a partir de las variables P14_M2, P14_M7, P14_M8, P14_M14 respectivamente. Respuesta: Anàlisis de ANOVA PEC4. ANÁLISIS MULTIVARIANTE(II) 6/8 La variable que tiene mayor discriminacion es P14_M7R correspondiente a Hogar Decoracion con un valor de F = 2,51, luego se sigue P14_M14R correspondientes a servicios ludicos, P14_M2R de CAF REST FFOOD y por ultimo P14_M8R de cines. Es importante señalar que ninguno de los valores de p para los analisis de ANOVA fue significativo, reduciendo el grado de discriminacion de las variables. 2.3 A partir de las dos variables que más discriminan (según el apartado anterior), construid un Detector Automático de Interacciones. ¿A qué conclusiones llegáis? ¿Tiene sentido hacer este análisis, según los resultados obtenidos en el apartado anterior? ¿Por qué? Respuesta: En primer lugar, tenemos que dividir la submuestra con la que estamos trabajando (clientes de fuera del barrio) en dos nuevas submuestras, a partir de la variable dicotómica "P14_M7R Hogar Decoración, que era la que más discriminaba. Tendremos dos nuevos grupos, uno formado por clientes (de fuera del barrio) que no van a Hogar Decoración, en total 226 y clientes, y que tienen un grado de satisfacción medio de 7.314. El otro grupo está formado sólo por 32 clientes, que tienen un grado de satisfacción de 7. Con esta información ya podemos dibujar la primera parte del Detector: Usuarios fuera del Barrio = 1 n = 258 Grado de satisfaccion 7,275 Decoracion Hogar = 0 n = 226 Grado de satisfaccion 7,314 Decoracion Hogar = 1 n = 32 Grado de satisfaccion 7 PEC4. ANÁLISIS MULTIVARIANTE(II) 7/8 Ahora, tenemos que hacer dos submuestras de la submuestra inicial. Una en la que P14_M7R=“0”, y otra en la que P14_M7R =”1”. En cada una de estas haremos otro análisis ANOVA, a partir de la variable "P14_M14R servicios Ludicos", que era la segunda que más discriminaba (en el subapartado anterior). Con la primera submuestra, obtenemos el siguiente resultado: A partir de esta información, el gráfico del detector nos quedará de la siguiente manera: A continuación, se hace lo mismo con la otra sub-submuestra, aquella que cumple la condición de que P14_M7R = “1”. Pero como partimos de un tamaño muy pequeño (N = 32), nos encontramos con el problema que en todos los casos de la submuestra el valor de la variable P14_M14R es siempre el mismo, "1": todos los clientes que utilizan los servicios lúdicos también utilizan los servicios de cafetería. Por tanto, no podemos hacer ningún análisis ANOVA y esta parte del árbol no se puede continuar. En consecuencia, el gráfico final del Detector es el anterior. No tiene mucho sentido hacer esta segmentación a partir de los resultados. La razón es que hemos considerado unas variables que discriminaban muy poco o no discriminaban, y eso no nos ha permitido segmentar mucho, obteniendo grupos no muy diferentes entre ellos, con grados de satisfacción muy similares. Usuarios fuera del Barrio = 1 n = 258 Grado de satisfaccion 7,275 Decoracion Hogar = 0 n = 226 Grado de satisfaccion 7,314 Servicios Ludicos = 0 n = 216 Grado de satisfaccion 7,34 Servicios Ludicos = 0 n = 10 Grado de satisfaccion 6,7 Decoracion Hogar = 1 n = 32 Grado de satisfaccion 7 PEC4. ANÁLISIS MULTIVARIANTE(II) 8/8 Materiales Módulos didácticos: Baró Llinàs, J.; Alemany Leira, R. (2002). “Análisis clúster”. En Estadística II. Ed. EDIUOC Camps Torres, F. (2001) “Análisis discriminante”. En Dirección comercial III. Ed. EDIUOC Meseguer Artola, A. (2002) “Detector automático de interacciones”. Ed. EDIUOC. Fichas: F028 - Análisis de conglomerados jerárquico F029 - Análisis de conglomerados no jerárquico F043 - Análisis discriminante F046 - Detector automático de interacciones http://materials.cv.uoc.edu/continguts/PID_00188469/recursos/analisi_cluster.pdf http://materials.cv.uoc.edu/continguts/PID_00188469/recursos/analisis_disc.pdf http://materials.cv.uoc.edu/continguts/PID_00188469/recursos/detector%20automatico_interacciones.pdf http://materials.cv.uoc.edu/continguts/PID_00203334/fitxa28/index.html http://materials.cv.uoc.edu/continguts/PID_00203334/fitxa29/index.html http://materials.cv.uoc.edu/continguts/PID_00203334/fitxa43/index.html http://materials.cv.uoc.edu/continguts/PID_00203334/fitxa46/index.html Criterios de evaluación Formato y fecha de entrega
Compartir