Logo Studenta

Estadistica_AnalisisMultivariante3

¡Estudia con miles de materiales!

Vista previa del material en texto

Análisis Multivariante 
Curso 2022-23 / 1º semestre 
 
 1/8 
Nombre y apellidos del estudiante 
 
Prueba de evaluación continua 4. ANÁLISIS MULTIVARIANTE(II) 
Criterios de evaluación 
Las preguntas y los problemas tienen que estar desarrollados y razonados. No se considerará 
correcta ninguna respuesta no argumentada. Cada pregunta vale ½ del total de puntos. 
Formato y fecha de entrega 
Las pruebas de evaluación continuada se tienen que entregar en el buzón específico de Entrega de actividades 
que se encuentra en el apartado Evaluación del aula en un único fichero en formato PDF. El último día para 
entregar esta actividad es el próximo 18 de diciembre de 2022. 
Enunciado 
A partir de los datos que hay en el fichero “Datos_CasoPractico1.csv”, en el que se basa el caso práctico de “El triángulo 
de las Bermudas”, se pide que contestéis razonadamente las siguientes cuestiones. El nivel de significación α que se debe 
de considerar en toda la PEC es de 0,05. 
Pregunta 1: 
En el último ejercicio de la PEC3, vimos cuál era la “posición” que ocupaban los tres centros 
comerciales que configuraban el llamado “Triángulo de las Bermudas”, según las valoraciones de 
los clientes de fuera del barrio de uno de ellos (Barcelona Glòries). Este posicionamiento lo 
analizamos a partir de la asociación que se hacía de cada característica a un centro comercial 
determinado. El gerente de Barcelona Glòries ya había podido sacar sus conclusiones, observando 
cuáles eran las características que se asociaban principalmente en su centro, y cuáles se asociaban 
a la competencia (Diagonal Mar y La Maquinista). 
De todos modos, quería profundizar un poco más en este análisis, y quería ver a qué grandes 
centros comerciales de Barcelona se parecía el suyo, tomando como punto de partida las 
valoraciones de los (sus) clientes de fuera del barrio de las 15 características (Car1 - Car15), 
obtenidas del cuestionario correspondiente (ver el apartado 5, “Imagen y posicionamiento del 
centro comercial”). Seleccionando sólo la submuestra de los clientes que usan el parking (que son 
de fuera del barrio), se obtienen los siguientes resultados agregados, para los 5 centros 
comerciales: 
 
 
Glòries Maquinista 
Corte 
Inglés 
Baricentro 
Diagonal 
Mar 
Car1 45 78 29 66 15 
Car2 37 95 26 42 13 
Car3 31 91 25 32 15 
Car4 48 80 16 44 17 
Car5 47 98 29 41 14 
Car6 33 83 30 53 16 
Car7 50 84 37 38 13 
Car8 53 91 25 42 16 
Car9 45 83 17 59 20 
Car10 37 77 23 40 14 
Car11 35 77 40 36 18 
Car12 25 112 20 38 16 
Car13 40 80 24 44 19 
Car14 32 101 6 23 13 
Car15 48 84 22 39 20 
PEC4. ANÁLISIS MULTIVARIANTE(II) 
 2/8 
Para responder a esta pregunta, se pide: 
1.1 Realiza un análisis clúster jerárquico (enlace simple y distancia euclídea) y encuentra el correspondiente 
dendrograma. ¿Cuántos grupos observamos? ¿Por qué centros comerciales están formados estos grupos? 
¿A qué (o cuáles) centro(s) comercial(es) se parece más Corte Inglés? ¿Por qué? ¿A qué otro grupo se 
parece más el que contiene Corte Inglés? Razonad las respuestas. 
 
Nota: Para resolver este apartado debéis copiar la tabla anterior en un nuevo conjunto de datos de R-
Commander. Debéis tener en cuenta, sin embargo, que para hacer este análisis se debe copiar la tabla transpuesta: 
así, por ejemplo, la primera fila de la tabla debe ser la primera columna del fichero de trabajo de R-Commander. 
 
Respuesta: 
 CentrosComerciales <- hclust(dist(model.matrix(~-1 + 
 Car1+Car2+Car3+Car4+Car5+Car6+Car7+Car8+Car9+Car10+Car11+Car12+Car13+Car14+Car15, Cluster)) 
+ , method= “single”) 
 plot(CentrosComerciales, main= “Cluster Dendrogram for Solution CentrosComerciales”, xlab= 
 “Observation Number in Data Set Cluster”, sub=”Method=single; Distance=euclidian”) 
 
 
 
Interpretación: Observamos tres grupos en el dendograma conformados por Clúster 1: Glories y 
Baricentro, Clúster 2: Corte Ingles y Diagonal Mar por último Clúster 3: Maquinista. El centro 
comercial Corte ingles queda equiparado al Diagonal del mar, por estar ambos centros comerciales 
formando el mismo clúster. De igual forma este clúster se asemeja al formado por Glories y Baricentro, 
por estar ambos clúster en el mismo nivel. Se observa que el centro comercial que tiene características 
totalmente distintas a los demás en el Maquinista que en si mismo forma un Clúster 
 
M
a
q
u
in
is
ta
G
lo
ri
e
s
B
a
ri
c
e
n
tr
o
C
o
rt
e
 I
n
g
le
s
D
ia
g
o
n
a
l 
M
a
r
0
5
0
1
0
0
1
5
0
Cluster Dendrogram for Solution CentrosComerciales
Method=single; Distance=euclidian
Observation Number in Data Set Cluster
H
e
ig
h
t
PEC4. ANÁLISIS MULTIVARIANTE(II) 
 3/8 
 
1.2 ¿El resultado obtenido es coherente con el obtenido en el ejercicio 3 de la PEC 3? Razonad la respuesta. 
 
Respuesta: 
 
En el ejercicio 3 del PEC 3 en el análisis de factores teníamos que el centro comercial Maquinista, 
Diagonal Mar y Glories tenía características distintas situándose en distintos sectores del mapa como 
se observa. Una situación similar la tenemos en el grafico de dendograma donde los tres pertenecen a 
distintos clúster. Por lo tanto existe total coherencia 
 
1.3 ¿En qué consiste el análisis clúster no jerárquico? ¿Se puede aplicar este análisis en nuestro caso? ¿Por 
qué? Razonad la respuesta. 
 
Respuesta: 
 
Análisis Clúster No Jerárquicos (Partitioning Clúster): Los métodos no jerárquicos categorizan los 
elementos según un número de clúster dado. Necesitan que el número de particiones esté fijado a 
priori. 
Este tipo de análisis no seria recomendable dado que el gerente desea saber cuales centros 
comerciales se parecen al suyo y al fijar el número de clúster estaría a priori estaría obligando la 
agrupación en un numero determinado que no resultaría provechoso para saber cual centro comercial 
se parece al suyo. 
 
 
 
 
 
 
 
 
 
 
Glories
Maquinista
Diagonal Mar
C1
C2
C3
C4
C5
C6
C7
C8
C9
C10
C11C12
C13
C14
C15
-0.1
0.0
0.1
-0.2 -0.1 0.0 0.1 0.2
Dim 1 (80.12%)
D
im
 2
 (
1
9
.8
8
%
)
CA factor map
PEC4. ANÁLISIS MULTIVARIANTE(II) 
 4/8 
 
 
Pregunta 2: 
El gerente quería volver a analizar el comportamiento de compra de sus clientes, y su relación 
con la valoración general del centro. Ahora que tenía mucha más información sobre los clientes 
de fuera del barrio, veía que había aspectos de su centro que debían considerarse con especial 
atención. Había visto, por ejemplo, que la oferta de ocio tenía un papel muy importante (esta 
era una de las variables significativas en el análisis de regresión del ejercicio 1 de la PEC3). 
Esta oferta de ocio, sin embargo, era muy diversa en su centro, y quería segmentar sus clientes 
a través de esta oferta, teniendo en cuenta su grado de satisfacción general (SATISF_GEN). Se 
pide: 
2.1 A partir de la base de datos “Datos_CasoPractico1.csv”, cread un nuevo conjunto de datos de nombre 
DatosPreg2 recogiendo las observaciones de los que usan el parking (P14_M23R==”1”). 
 
Calculad la matriz de correlaciones entre las variables siguientes que recogen la satisfacción sobre diversos 
aspectos. Dad una interpretación a los resultados que obtengáis. 
P34_1 PRECIOS 
P34_2 PROMOCIONES OFERTES 
P34_3 VARIEDAD DE LAS TIENDAS 
P34_4 CALIDAD DE LAS TIENDAS 
P34_5 PARKING 
 
 
Respuesta: 
 
 
 
 
Interpretacion: Con los coeficientes obtenidos podemos establecer las siguientes correlaciones significativas: 
entre las variables ( P34_3 y P34_4) es alta. Para las variables ( P34_1 y P34_2); ( P34_1 y P34_3) y ( 
P34_2 y P34_3) moderada. Para las variables ( P34_1 y P34_4); ( P34_2 y P34_4); ( P34_2 y P34_5) y ( 
P34_3 y P34_5); es baja. Todas las correlaciones fueron positivas dando lugar a una relación directamente 
proporcional en los niveles antes mencionados. Para el par ( P34_1 y P34_5) la correlación fue muy baja y 
no significativa. 
PEC4. ANÁLISIS MULTIVARIANTE(II) 
 5/82.2 A partir de las siguientes variables dicotómicas que dan información sobre si los clientes usan o no el servicio: 
 
P14_M2R CAF REST FFOOD 
P14_M7R HOGAR DECORACIÓN 
P14_M8R CINES 
P14_M14 SERVICIOS LÚDICOS 
 
Se pide que hagáis un análisis ANOVA de cada una de ellas respecto a la variable satisfacción general 
(SATISF_GEN). ¿Cuál de estas 4 variables discrimina más? ¿Por qué? 
Nota: Previamente hay que crear las variables P14_M2R, P14_M7R, P14_M8R, P14_M14R como factores a 
partir de las variables P14_M2, P14_M7, P14_M8, P14_M14 respectivamente. 
 
 
Respuesta: 
 
Anàlisis de ANOVA 
 
 
 
 
 
 
PEC4. ANÁLISIS MULTIVARIANTE(II) 
 6/8 
 
 
 
 
 
 
La variable que tiene mayor discriminacion es P14_M7R correspondiente a Hogar Decoracion con un 
valor de F = 2,51, luego se sigue P14_M14R correspondientes a servicios ludicos, P14_M2R de CAF REST 
FFOOD y por ultimo P14_M8R de cines. Es importante señalar que ninguno de los valores de p para los 
analisis de ANOVA fue significativo, reduciendo el grado de discriminacion de las variables. 
 
2.3 A partir de las dos variables que más discriminan (según el apartado anterior), construid un Detector Automático de 
Interacciones. ¿A qué conclusiones llegáis? ¿Tiene sentido hacer este análisis, según los resultados obtenidos en el 
apartado anterior? ¿Por qué? 
 
Respuesta: 
 
 
En primer lugar, tenemos que dividir la submuestra con la que estamos trabajando (clientes de fuera del barrio) 
en dos nuevas submuestras, a partir de la variable dicotómica "P14_M7R Hogar Decoración, que era la que 
más discriminaba. 
Tendremos dos nuevos grupos, uno formado por clientes (de fuera del barrio) que no van a Hogar Decoración, 
en total 226 y clientes, y que tienen un grado de satisfacción medio de 7.314. El otro grupo está formado sólo 
por 32 clientes, que tienen un grado de satisfacción de 7. 
 
Con esta información ya podemos dibujar la primera parte del Detector: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Usuarios fuera del Barrio = 1 
n = 258 
Grado de satisfaccion 7,275
Decoracion Hogar = 0 
n = 226 
Grado de satisfaccion 7,314
Decoracion Hogar = 1 
n = 32
Grado de satisfaccion 7
PEC4. ANÁLISIS MULTIVARIANTE(II) 
 7/8 
 
Ahora, tenemos que hacer dos submuestras de la submuestra inicial. Una en la que P14_M7R=“0”, y otra en 
la que P14_M7R =”1”. En cada una de estas haremos otro análisis ANOVA, a partir de la variable "P14_M14R 
servicios Ludicos", que era la segunda que más discriminaba (en el subapartado anterior). Con la primera 
submuestra, obtenemos el siguiente resultado: 
A partir de esta información, el gráfico del detector nos quedará de la siguiente manera: 
 
A continuación, se hace lo mismo con la otra sub-submuestra, aquella que cumple la condición de que 
P14_M7R = “1”. Pero como partimos de un tamaño muy pequeño (N = 32), nos encontramos con el problema 
que en todos los casos de la submuestra el valor de la variable P14_M14R es siempre el mismo, "1": todos los 
clientes que utilizan los servicios lúdicos también utilizan los servicios de cafetería. Por tanto, no podemos 
hacer ningún análisis ANOVA y esta parte del árbol no se puede continuar. En consecuencia, el gráfico final 
del Detector es el anterior. 
No tiene mucho sentido hacer esta segmentación a partir de los resultados. La razón es que hemos considerado 
unas variables que discriminaban muy poco o no discriminaban, y eso no nos ha permitido segmentar mucho, 
obteniendo grupos no muy diferentes entre ellos, con grados de satisfacción muy similares. 
Usuarios fuera del Barrio = 1 
n = 258 
Grado de satisfaccion 7,275
Decoracion Hogar = 0 
n = 226 
Grado de satisfaccion 7,314
Servicios Ludicos = 0
n = 216
Grado de satisfaccion 7,34
Servicios Ludicos = 0
n = 10
Grado de satisfaccion 6,7
Decoracion Hogar = 1 
n = 32
Grado de satisfaccion 7
PEC4. ANÁLISIS MULTIVARIANTE(II) 
 8/8 
 
Materiales 
Módulos didácticos: 
 Baró Llinàs, J.; Alemany Leira, R. (2002). “Análisis clúster”. En Estadística II. Ed. EDIUOC 
 Camps Torres, F. (2001) “Análisis discriminante”. En Dirección comercial III. Ed. EDIUOC 
 Meseguer Artola, A. (2002) “Detector automático de interacciones”. Ed. EDIUOC. 
 
Fichas: 
 F028 - Análisis de conglomerados jerárquico 
 F029 - Análisis de conglomerados no jerárquico 
 F043 - Análisis discriminante 
 F046 - Detector automático de interacciones 
 
 
 
http://materials.cv.uoc.edu/continguts/PID_00188469/recursos/analisi_cluster.pdf
http://materials.cv.uoc.edu/continguts/PID_00188469/recursos/analisis_disc.pdf
http://materials.cv.uoc.edu/continguts/PID_00188469/recursos/detector%20automatico_interacciones.pdf
http://materials.cv.uoc.edu/continguts/PID_00203334/fitxa28/index.html
http://materials.cv.uoc.edu/continguts/PID_00203334/fitxa29/index.html
http://materials.cv.uoc.edu/continguts/PID_00203334/fitxa43/index.html
http://materials.cv.uoc.edu/continguts/PID_00203334/fitxa46/index.html
	Criterios de evaluación
	Formato y fecha de entrega

Continuar navegando