Logo Studenta

Análisis discriminante y conjunto

¡Estudia con miles de materiales!

Vista previa del material en texto

Universidad de los Andes 
Facultad de Ciencia Económicas y Empresariales 
Apunte preparado por el profesor David Kimber para el curso de Inteligencia de Marketing 
 
 
APUNTE ANÁLISIS DISCRIMINANTE Y CONJUNTO 
 
1 Análisis Discriminante 
 
El análisis discriminante, basándose en un conjunto de variables Xi, busca distinguir entre varios 
grupos mutuamente excluyentes predefinidos (existen a priori). Su tarea será identificar entre 
las variables utilizadas para definir a los individuos, cuáles son las importantes, las que marcan 
diferencias entre grupos. A partir de este procedimiento, se obtendrá una combinación lineal 
de variables independientes que generan los grupos. 
 
Este tipo de análisis tiene tres objetivos claros: 
1. Determinar si existen diferencias significativas entre 2 o más grupos definidos a priori 
2. Determinar las variables que mejor discriminan entre grupos 
3. Establecer procedimientos para clasificar objetos 
 
Entonces, busca determinar la combinación lineal de variables que maximiza la varianza entre 
grupos relativa a la intra grupos, con el fin de predecir y explicar las relaciones que influyen en 
la categoría en que un objeto está situado o es asignado. Gráficamente se puede apreciar para 
el caso de dos grupos en las siguientes figuras. 
 
 
 
La combinación lineal de variables se denomina función Z, y si se cumplen los supuestos, esta 
función se distribuye normal como aparece en las figuras anteriores. 
 
 
 
Una vez que se estima la función Z, se estima para cada individuo en la muestra un puntaje Z. 
Con estas estimaciones se calcula el centroide de cada grupo y mediante estos se calcula la 
puntuación de corte. Así, comparando el valor Z de cada individuo contra la puntuación de corte 
se realiza la asignación y se evalúa el error de clasificación. En el caso de las figuras de arriba 
(dos grupos) si Zi es menor a la puntuación de corte el individuo se asigna al grupo A, en caso 
de ser mayor al grupo B. Esto dará lugar a matrices de comparación en que se analiza que 
porcentaje de la muestra está bien clasificado y permite comparar entre diferentes modelos 
discriminantes, siendo el mejor, aquel que tenga un menor error de clasificación. Para el caso 
de cuatro grupos una matriz de clasificación se vería de la siguiente forma: 
 
	 
kkkjk XwXwXwaz 332211 +++=
Universidad de los Andes 
Facultad de Ciencia Económicas y Empresariales 
Apunte preparado por el profesor David Kimber para el curso de Inteligencia de Marketing 
 
 
 | Clasificación 
 Grupo real | 1 2 3 4 | Total 
 -------------+--------------------------------+------- 
 1 | 47 4 0 0 | 51 
 | 92.16 7.84 0.00 0.00 | 100.00 
 | | 
 2 | 0 129 21 0 | 150 
 | 0.00 86.00 14.00 0.00 | 100.00 
 | | 
 3 | 0 1 297 0 | 298 
 | 0.00 0.34 99.66 0.00 | 100.00 
 | | 
 4 | 0 0 0 1 | 1 
 | 0.00 0.00 0.00 100.00 | 100.00 
 -------------+--------------------------------+------- 
 Total | 47 134 318 1 | 500 
 | 9.40 26.80 63.60 0.20 | 100.00 
 | | 
 Priors | 0.1020 0.3000 0.5960 0.0020 | 
 
Nota: Priors, indica % de participación de cada grupo en la muestra. 
 
En la matriz de clasificación, se debe ver cuál es el porcentaje de mal clasificados. En este caso, 
el 94,8% está bien clasificado, por ende, el modelo predice bien el grupo de pertenencia. Para 
ver esto se suma la diagonal (los bien clasificados) y se divide por el total de la muestra 
 
Un contraste para evaluar la predicción es ver cuánto es el grupo de mayor porcentaje y exigir 
que la predicción del modelo sea mayor a eso. Para el caso, el criterio de contraste sería 59,6%= 
298/500… entonces se pide que el modelo haga una predicción correcta de al menos el 59,6% 
de los casos. Se cumple (94,8>59,6). 
 
1.1 Supuestos 
 
En este análisis deben cumplirse tres supuestos básicos: 
1. Las variables independientes se distribuyen normal multivariado. 
2. La matriz de varianzas-covarianzas entre grupos son iguales (HN de test M de Box1). 
3. Las medias de los grupos son distintas (HA de test Lambda de Wilks). 
4. No existen outliers. 
5. Las variables independientes poseen baja multicolinealidad. 
 
Para evaluar la significancia del análisis se analiza el lambda de Wilks (W en tabla de abajo). En 
general, lo que se busca es rechazar la HN de que no existen grupos distintos (todos son iguales). 
Es decir, que el modelo discrimina bien, separa bien a los diferentes grupos. Para el caso de 4 
grupos se vería así: 
 Number of obs = 500 
 
 W = Wilks' lambda L = Lawley-Hotelling trace 
 P = Pillai's trace R = Roy's largest root 
 
 Source | Statistic df F(df1, df2) = F Prob>F 
 -----------+-------------------------------------------------- 
 | W 0.0976 3 24.0 1418.8 72.75 0.0000 a 
 | P 1.0031 24.0 1473.0 30.83 0.0000 a 
 | L 8.2335 24.0 1463.0 167.30 0.0000 a 
 | R 8.1119 8.0 491.0 497.87 0.0000 u 
 |-------------------------------------------------- 
 Residual | 496 
 -----------+-------------------------------------------------- 
 Total | 499 
 
1 Se debe tener en cuenta que el test M de Box es sensible al tamaño de la muestra por lo que para n mayor a 350 es 
posible que el test rechace la HN, aunque se cumpla el supuesto. 
Universidad de los Andes 
Facultad de Ciencia Económicas y Empresariales 
Apunte preparado por el profesor David Kimber para el curso de Inteligencia de Marketing 
 
 
Una vez establecido esto, se desea evaluar qué variables del modelo ayudan a discriminar. 
Nuevamente se testea la significancia estadística y buscamos rechazar HN que de variable no 
discrimina (en una regresión sería que su beta es 0). Ejemplo: 
 
Univariate ANOVA summaries 
 
 | Adj. 
 Variable | Model MS Resid MS Total MS R-sq R-sq F Pr > F 
 ------------+--------------------------------------------------------------- 
 a049 | 95.238256 789.31174 785.13896 0.1077 0.1023 19.949 0.0000 
 a070p | 11523.695 117421.5 116784.84 0.0894 0.0839 16.226 0.0000 
 p352 | 1.012e+08 22461556 22934763 0.8183 0.8172 744.7 0.0000 
 p601 | 51320.174 348052.57 346268.61 0.1285 0.1232 24.378 0.0000 
 p603 | 65659.357 684359 680639.37 0.0875 0.0820 15.863 0.0000 
 p604 | 51968.577 1180944.6 1174157.2 0.0422 0.0364 7.2756 0.0001 
 p607 | 823335.45 3478922.8 3462957.4 0.1914 0.1865 39.128 0.0000 
 p609 | 9098854 3030853.1 3067334 0.7501 0.7486 496.34 0.0000 
 ---------------------------------------------------------------------------- 
 Number of obs = 500 Model df = 3 Residual df = 496 
 
Dados los resultados, valor p<0,05 en todas las variables… entonces, todas las variables del 
modelo ayudan a discriminar. 
 
Luego, se estimarán las funciones discriminantes. Estas funciones son aquellas que nos 
permitirán separar en el espacio Rn los individuos basado en los valores de las variables en estas 
funciones (en una regresión estos serían los valores beta asociadosa cada variable en cada 
función). 
 
Standardized canonical discriminant function coefficients 
 
 | function1 function2 function3 
 -------------+--------------------------------- 
 a049 | .0664119 -.0298033 .1108706 
 a070p | -.005377 -.0750505 -.8149724 
 p352 | .9818461 .076722 -.1894029 
 p601 | -.0383796 .2257561 .4411837 
 p603 | -.0478238 .0874582 .1338622 
 p604 | -.0364398 -.0688277 -.0654486 
 p607 | .1853963 .1163774 -.0868615 
 p609 | .0098275 -1.040742 .0364686 
 
Si deseamos darles un nombre a las funciones discriminantes (ejemplo: en un mapa perceptual) 
usaremos matriz estructura para ver la correlación entre cada variable y cada función (es similar 
a la matriz de cargas factoriales del análisis de factores). 
 
Canonical structure 
 
 | function1 function2 function3 
 -------------+--------------------------------- 
 a049 | .1494689 .0029545 .608862 
 a070p | -.1171451 -.0340365 -.8352214 
 p352 | .9808466 .0069384 -.0279371 
 p601 | .1704032 .0168183 .4949976 
 p603 | .1410135 -.0077995 .2476832 
 p604 | .0927485 -.0331244 .0710589 
 p607 | .2246481 .0066346 .0767936 
 p609 | .1442744 -.9520468 .1728106 
 
Para evaluar si las funciones discriminantes son significativas, es decir lo que aporta cada función 
al modelo, se analiza su significancia. En este caso, se busca rechazar que la función no aporta 
(p<0,05). Así, si en el caso puntual de 3 funciones la tercera nos diera no significativa esto nos 
Universidad de los Andes 
Facultad de Ciencia Económicas y Empresariales 
Apunte preparado por el profesor David Kimber para el curso de Inteligencia de Marketing 
 
indicaría que basta trabajar con sólo dos funciones para discriminar a los individuos en el 
modelo. Para el caso que estamos analizando, las tres funciones son significativas: 
 
Canonical linear discriminant analysis 
 
 | | Like- 
 | Canon. Eigen- Variance | lihood 
 Fcn | Corr. value Prop. Cumul. | Ratio F df1 df2 Prob>F 
 ----+---------------------------------+------------------------------------ 
 1 | 0.9077 4.68165 0.5905 0.5905 | 0.0401 120.03 24 1419 0.0000 a 
 2 | 0.8730 3.20318 0.4040 0.9945 | 0.2280 76.583 14 980 0.0000 e 
 3 | 0.2036 .043267 0.0055 1.0000 | 0.9585 3.5406 6 491 0.0019 e 
 --------------------------------------------------------------------------- 
 Ho: this and smaller canon. corr. are zero; e = exact F, a = approximate F 
 
Ya probamos que el modelo funcionaba con las variables utilizadas. Además, evaluamos que 
variables y funciones ayudaban a discriminar mejor (en este caso particular todas). Entonces, 
sólo falta tener una forma de clasificar nuevos individuos de una manera simple. Para esto se 
estiman las funciones de clasificación. 
En el caso de las funciones de clasificación, se estima una por grupo. Así, un individuo nuevo 
(cliente nuevo o no clasificado previamente para estimar el modelo), quedará clasificado en el 
grupo en que, a raíz de las respuestas a las preguntas asociadas a las variables utilizadas en el 
modelo, obtenga un mayor valor. En este caso en particular, se estiman 4 funciones de 
clasificación: 
 
Classification functions 
 
 | 1 2 3 4 
 -------------+-------------------------------------------- 
 a049 | 3.042063 2.86702 2.696269 3.658498 
 a070p | .3378921 .3055392 .3270577 .5147398 
 p352 | .0377713 .017393 .0058755 -.0079446 
 p601 | -.0428025 -.0249295 -.0274611 -.3656219 
 p603 | -.0165555 -.0084211 -.0064452 -.100133 
 p604 | .0164949 .0186722 .021076 .0770848 
 p607 | .0251544 .0151667 .0099186 -.0453473 
 p609 | .0059011 .0037719 .0028428 .5342776 
 _cons | -48.2767 -19.69703 -13.20127 -831.2915 
 -------------+-------------------------------------------- 
 Priors | .102 .3 .596 .002 
 
Finalmente, para hacer un perfil básico de los grupos sólo usando las variables del modelo 
utilizamos las medias de cada variable en cada grupo. Obviamente, en cada variable hay que 
verificar qué significan las medias. En este caso en particular, a049 es la frecuencia de compra, 
a070p es la edad y p352 el ingreso. A partir de solo estos datos es posible ver que existe un 
outlier en la muestra (grupo 4) que tiene una edad muy alta y los más bajos ingresos versus la 
muestra. 
Estimation sample discrim lda 
Summarized by kmed 
 
 | kmed 
 Mean | 1 2 3 4 | Total 
 -------------+--------------------------------------------+---------- 
 a049 | 3.137255 2.806667 2.020134 2 | 2.37 
 a070p | 46.7451 46.38667 56.05034 75 | 52.24 
 p352 | 1707.277 804.7738 269.7992 241.094 | 576.8569 
 p601 | 65.52441 54.35697 37.60757 22.215 | 45.44912 
 p603 | 48.39597 31.55659 14.4544 28 | 23.07419 
 p604 | 65.27275 47.72391 34.66183 100.295 | 41.83403 
 p607 | 156.8055 79.87917 28.93891 10.4 | 57.22631 
 p609 | 126.753 76.13013 39.43627 3013.065 | 65.29799 
 -------------+--------------------------------------------+---------- 
 N | 51 150 298 1 | 500 
	 
Universidad de los Andes 
Facultad de Ciencia Económicas y Empresariales 
Apunte preparado por el profesor David Kimber para el curso de Inteligencia de Marketing 
 
 
2 Análisis conjunto 
 
El análisis conjunto es una técnica de dependencia en la que se infiere la utilidad o valor que 
tienen los atributos de un producto o servicio para los individuos (consumidores), a partir de la 
preferencia que expresan por combinaciones variadas de esos atributos (juicios de trade-off). 
Permite entender como las personas realizan “juicios complejos” (Popović, Kuzmanović, & 
Martić; 2012) 
 
Para estudiar un producto o marca puede ser preferible considerarlo como una configuración 
de atributos escalados a ciertos niveles, en lugar de analizar cada atributo individual. 
 
2.1 Utilidad 
 
Sirve para comparar la utilidad que reportan 2 o más grupos de atributos a los individuos. Se 
utiliza para: 
• Generación de Nuevos Productos 
• Segmentar Mercados 
• Modificar Productos 
• Estudiar Sensibilidad Precio 
• Predecir resultados de venta y participación 
 
Se analizan paquetes de atributos, buscando encontrar la combinación óptima para consumidor 
y productor. En particular, se analizan las concesiones que dan los consumidores y el nivel de 
utilidad que les reporta cada nivel de atributo. 
 
La cantidad de juicios que deben emitir los encuestados permite que no exista sesgo de 
respuesta por deseabilidad social u otra razón. Este análisis logra develar las concesiones cuasi 
inconscientes que están dispuestos a realizar los consumidores por obtener más de un atributo 
versus otros. 
 
2.2 Ventajas 
 
1. Se basa en la forma como los consumidores perciben las alternativas competitivas en el 
mercado. 
2. Evalúa los atributos, dando una guía para la elaboración de los programas de marketing 
y comunicación. 
3. Proporciona sugerencias para nuevas configuraciones de productos o servicios. 
4. Ayuda a la simulación de situaciones competitivas comparando ofertas propias contra 
las de los competidores. 
 
2.3 Métodos de aplicación del análisis 
 
2.3.1 Comparación Perfil Total (full profile) 
1. más realista 
2. se puede utilizar ranking o rating paracomparar 
3. menos juicios que en el otro método 
4. problema cuando el n° de atributos es muy grande 
 
2.3.2 Comparación por Pares (trade-off) 
1. Se requieren más juicios 
2. Poco realista 
3. Correlación de atributos (Precio – Calidad) 
Universidad de los Andes 
Facultad de Ciencia Económicas y Empresariales 
Apunte preparado por el profesor David Kimber para el curso de Inteligencia de Marketing 
 
 
2.4 Análisis de resultados, caso: Lavalozas 
 
Posterior a la emisión de juicios por parte de los encuestados, se deben analizar los resultados 
del análisis conjunto, para esto se debe: 
 
1. Ver la importancia absoluta de los atributos. Para ver el atributo más valorado (que no 
necesariamente es el más importante). 
2. Para cada atributo, comparar la máxima utilidad de uno de sus niveles con la mínima. 
Obtener la diferencia. 
3. Luego, aquellos atributos con mayor diferencia son más importantes 
4. Pueden jugar un papel diferenciador 
5. Diferencias dependen de niveles de atributos 
 
 
En el caso de lavalozas, el atributo con mayores niveles de utilidad para cada uno de sus niveles 
es el envase. Sin embargo, no es el más importante, pues aquel con mayor diferencia de utilidad 
es concentración y luego, nivel desengrasante. Esto quiere decir que ante cualquier combinación 
de atributos/niveles, lo que modificará la utilidad obtenida por el consumidor y por tanto, la 
probabilidad que lo compre, será en primer lugar la concentración y posteriormente cuan 
desengrasante es. Cambiar de envase, no provoca grandes cambios en la utilidad percibida por 
el comprador en este caso, de hecho, es el atributo menos importante. 
 
2.5 Nota Importante 
• Este análisis es sensible a los atributos y niveles de estos elegidos, pudiendo cambiar los 
resultados ante cambios en estos. 
• También se sabe que aquellas variables con mayor cantidad de niveles de utilidad 
pueden resultar como las más importantes, no tanto porque lo sean, sino por mostrar 
una mayor diversidad de niveles a los encuestados versus atributos alternativos con 
menos niveles. 
• Finalmente, a pesar de entenderse como un análisis de dependencia, el análisis 
conjunto en esencia es un procedimiento para obtener respuestas complejas, cuyos 
resultados (elecciones) se analizarán con otras técnicas de dependencia como la 
regresión lineal, la regresión ordinal logística o la regresión logística multinomial. 
Atributo 1
0,9 0,6 0,3
Alta Media Normal
Concentración
Ut
ili
da
d
Atributo 2
0,9 0,8 0,7
Anatómico Standard Multiuso
Envase
Ut
ili
da
d
Atributo 3
0,8 0,6 0,4
US$ 5 US$ 7 US$ 10
Precio
Ut
ili
da
d
Atributo 4
0,7 0,5
0,2
Alto Medio Bajo
Nivel Desengrasante
Ut
ili
da
d

Otros materiales