Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
EL ANALISIS CLUSTER EN INVESTIGACIÓN DE MARKETING: METODOLOGIA Y CRITICA MONICA GOMEZ SUAREZ UNIVERSIDAD AUTONOMA DE MADRID1 Resumen: En este trabajo se realiza un análisis crítico de la literatura sobre la aplicación de la técnica de cluster en marketing durante los años noventa. Para ello, se exponen en primer lugar una serie de pasos esenciales a seguir según los expertos cuando se aplica dicha técnica. A continuación se revisa el número de artículos y tesis doctorales escritos en el extranjero en el período 1987-1997, llevándose a cabo con posterioridad una análisis exhaustivo sobre la utilización del cluster en marketing dentro de nuestro país (1990-1997). Por último, se expone una aplicación práctica de la técnica que sigue los pasos anteriormente descritos. Summary This article presents an examination of the literature written about the application of the cluster analysis in marketing in the 90’s. First, we introduce the required steps when applying this technique in the experts point of view. Afterwards, the number of articles and dissertations publised abroad (1987-1997) is under review, studying as well the applicarion of cluster in marketing in Spain (1990-1997). Finally, there is a exposition about the practical use of the technique, which follows the steps described before. 1 Dpto. Financiación e Investigación Comercial. Facultad de CC.Empresariales. UAM. 28049 CANTOBLANCO. MADRID. Tfno: (91)3974348. EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 1. INTRODUCCION El desarrollo informático ha extendido la aplicación en el área de marketing de distintas técnicas de análisis de datos con gran complejidad estadística. Entre los procedimientos más empleados se encuentran el análisis factorial, la regresión múltiple, el análisis discriminante múltiple y el análisis cluster. El objetivo principal de esta última técnica multivariante es la búsqueda de grupos u objetos relativamente homogéneos. Su nombre se utiliza para definir una serie de técnicas que tienen por objeto la búsqueda de grupos similares de individuos o de variables que se van agrupando en conglomerados. Si tenemos una muestra de individuos, de cada uno de los cuales se dispone de una serie de observaciones, el análisis cluster sirve para clasificarlos en grupos lo más homogéneos posible en base a las variables observadas2. El origen de esta técnica multivariante se encuentra en la biología y la botánica, debido a que los investigadores de estas áreas de conocimiento tenían la necesidad de agrupar las distintas especies de animales y vegetales conocidas, en familias que fueran lo más homogéneas posibles (Miquel, Bigné y otros, 1997, p.268). La variedad de nombres con los que se denomina a esta técnica se debe precisamente a su utilización en muy diversas disciplinas, tales como la psicología, la sociología, la economía o la ingeniería. A pesar de ello, todos los métodos desarrollados tienen una dimensión común: clasificar de acuerdo con la relación natural que existe entre los sujetos u objetos (Hair, Anderson y otros, 1995). El análisis cluster se conoce desde hace varias décadas. En los años 30 se desarrollaron algunas tímidas aplicaciones, aunque comenzó a adquirir verdadero auge fue en los años 50. Las aplicaciones del análisis cluster al marketing han sido múltiples, aunque, lógicamente, el campo donde mayores niveles de aplicación alcanza y donde más beneficios ofrece es el de la segmentación de mercados. También se ha utilizado en la identificación de hábitos de compra, de grupos de productos competitivos, valoración de productos de competidores o identificación de localidades que serán usadas posteriormente como mercados de prueba. En los últimos años, se ha revelado como la técnica más utilizada en el análisis de grupos estratégicos y en el desarrollo de tipologías estratégicas, casi siempre en combinación con otras técnicas multivariantes, como el análisis factorial y el análisis de la varianza. Sin embargo, el uso del análisis cluster también ha sido objeto de numerosos ataques, tanto dentro de la investigación de marketing como de la dirección estratégica (Green, Frank y Robinson, 1967; Morrison, 1967; Schuman, 1967; Funkhouser, 1983; Ketchen y Shook, 1996; Barney y Hoskisson, 1990; Meyer, 1991), fundamentalmente por los siguientes aspectos: i. La excesiva confianza que se deposita en el juicio del investigador al aplicar esta técnica, ya que, a diferencia de otros métodos, el cluster no ofrece un contraste estadístico que facilite una respuesta concreta sobre la confirmación o no de los resultados que sirven de apoyo a las hipótesis planteadas en la investigación. ii. Muchas aplicaciones del análisis cluster no se han basado en una racionalidad teórica. A menudo, las dimensiones o variables parecen haberse seleccionado al azar y los grupos que se identifican no reflejan condiciones reales sino que son simples “artificios estadísticos supeditados a variaciones númericas aleatorias entre organizaciones” (Thomas y Venkatraman, 1988). De ahí que con la utilización del cluster se asuma un 2 La palabra "cluster", que define estas técnicas, se podría traducir como grupo, conglomerado, racimo, apiñarse. En general, en todos los paquetes estadísticos se conserva su nombre inglés, aunque también se conoce como análisis de conglomerados, taxonomía numérica, análisis tipológico o clasificación automática. El cluster se puede utilizar de dos formas muy distintas: clasificación o representación de estructuras de datos. El primer objetivo -clasificación- es la más común de las aplicaciones (Punj y Stewart, 1983). Por esta razón, el artículo se centra en el cluster como forma de clasificación. Gómez Suárez. Mónica notable grado de riesgo de ofrecer clasificaciones inexactas, sino imponiendo grupos que realmente no existen. iii. La escasa fiabilidad que algunos autores atribuyen a determinados algoritmos de agrupación (Funkhouser, 1983). Incluso algunos autores han afirmado que esta técnica es un “estigma metodológico” (Meyer, 1991) cuestionando su valor como método aplicado a la investigación, debido a los resultados equívocos a los que lleva a veces su utilización (por ejemplo, en la configuración de grupos estratégicos, donde no se ha demostrado de forma consistente la relación entre la pertenencia a un grupo y los resultados). A pesar de esta controversia, el análisis cluster sigue siendo una de las técnicas multivariantes más utililizadas por los investigadores de marketing en nuestro país. Por esta razón, el propósito de este artículo es analizar su aplicación actual dentro de esta disciplina en España, haciendo primero un breve repaso de la situación a nivel internacional. Nuestro objetivo no es sólo evaluar su uso en el pasado, sino también configurar unas líneas maestras que guíen la investigación mediante su aplicación en el futuro, para poder hacer posible su mejor utilización. Para ello, en este trabajo, describimos que aspectos son críticos en la metodología de una investigación cuando se utiliza el cluster. Posteriormente, analizamos numéricamente la evolución de las publicaciones basadas en la aplicación de esta técnica a nivel internacional dentro del marketing. A continuación, realizamos una revisión metodológica en profundidad de los artículos y ponencias publicados en España en los años 90 en las principales revistas y congresos relacionados con esta disciplina. Por último, a través de una aplicación práctica y como resultado de la comparación entre las prácticas existentes y las que proponemos, ofrecemos una serie de recomendaciones que ayuden a los investigadores de marketing a maximizar el valor del análisis cluster. El objetivo de este artículo no es analizar, sin embargo, las primeras aplicaciones en el ámbitodel marketing ni hacer un resumen de su gestación como técnica, sino estudiar la utilización en su época de consolidación. 2. ASPECTOS CONCEPTUALES Y CRITICOS En este epígrafe exponemos los principales aspectos relacionados con la aplicación del análisis cluster. No tratamos de ofrecer, sin embargo, una explicación detallada de todos los puntos específicos que acompañan a la aplicación de esta técnica (algoritmos, medidas de distancia, etc), puesto que éstos ya aparecen en una serie de publicaciones anteriores3, tanto dentro como fuera del área de marketing. No resulta muy difícil agrupar estos aspectos, ya que la mayoría de los expertos han destacado varios de ellos. Sí es una tarea más complicada determinar cuál debe ser la metodología correcta pues, en la mayoría de los casos, estos mismos expertos no han llegado a un acuerdo. Como primera medida, hemos determinado una serie de puntos esenciales por los que cualquier investigador debe optar al aplicar esta técnica. Al no existir un consenso sobre qué elección es la mejor en algunas ocasiones, el investigador debe analizar las fuerzas o debilidades de un determinado enfoque y elegir áquel que resulte más conveniente a la hora de aportar objetividad a la investigación que desarrolla. Estos puntos esenciales al aplicar el análisis cluster son: la selección de variables, los algoritmos o métodos de agrupación, la determinación del número de grupos y la validación de los resultados4. Selección de variables 3 Por ejemplo, Klastorin (1983), Punj y Stewart (1983), Bisquerra (1989), Noururis (1993), Hair y otros (1995), Kinnear y Taylor (1996), Miquel, Bigné y otros (1997). 4 El esquema que seguimos se basa en el artículo publicado por Ketchen y Shook en el Strategic Management Journal en 1996. Dicho artículo analizaba todos las investigaciones sobre estrategia publicadas en las seis revistas prestigiosas de management (Academy of Management Journal, Journal of International Business Studies, Journal of Management, Management Science y Strategic Management Journal) desde 1977 hasta 1993. EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... La selección de variables que se incluyen en el análisis es una paso crucial, ya que si se excluyen variables importantes éste será insuficiente y pobre. En el cluster, la selección inicial de variables determina las características que se usarán para identificar los grupos. Existen fundamentalmente tres métodos de selección de variables: inductivo, deductivo y cognitivo. El primero, en el que ni las variables ni el número de grupos que se espera obtener tienen un nexo con una teoría, es el que más se utiliza en estudios exploratorios. El segundo se apoya en la literatura teórica preexistente. A diferencia del anterior, la consistencia interna de los grupos es mayor, ya que no se incluyen variables irrelevantes que disminuyen la validez de las agrupaciones resultantes. El método congnitivo está muy cercano, en la práctica, al inductivo, ya que no se basa en apreciaciones teóricas (hipótesis), sino que utiliza las predicciones de determinados expertos de la industria para definir las variables (Ketchen y Shook, 1996). La selección de variables basada en uno de estos tres métodos depende de los objetivos de la investigación. Si existe una teoría previa, se debe confirmar mediante la utilización de las variables que facilita. No obstante, en muchas ocasiones, los estudios realizados en el campo del marketing son exploratorios y, por tanto, se debe recurrir a un enfoque inductivo o cognitivo. Si tenemos acceso a las opiniones de expertos, es recomendable considerarlas, ya que de esta forma aumentaremos la probabilidad de que las variables reflejen fielmente la realidad. La estandarización de las variables y la utilización de factores que provienen de un análisis factorial previo son también dos aspectos que se deben tratar en este epígrafe. Al utilizar diferentes unidades de medida en las distintas variables, áquellas que se midan con grandes números solaparán a las que se miden con números pequeños. Para resolver este problema se pueden estandarizar las variables aunque no siempre es la mejor estrategia, ya que el proceso de estandarización permite que las variables contribuyan de igual forma a la definición de los grupos, pero también puede eliminar diferencias significativas entre los elementos de análisis (Funkhouser, 1983). Debido a que no hay un consenso entre los expertos en cuanto a la estandarización o no de las variables, la mejor estrategia es emplear ambos enfoques (estandarización y no estandarización). Si la solución no es consistente, entonces se debe mirar la validez de los resultados de cada uno de ellos y elegir áquel cuya solución aporte mayor confianza. En cuanto a la utilización de factores que provienen de una análisis factorial previo, se pretende eliminar con ella la multicolinealidad entre variables. También la utilización de factores, en vez de variables, ha suscitado controversias entre los investigadores, ya que al emplear sólo los factores que tienen mayor autovalor se puede eliminar información que pueda ser importante a la hora de diferenciar entre los individuos5. En este caso, ocurre como con la estandarización, se debe determinar el impacto que tiene la utilización de los factores o de las variables por separado en la consistencia de los grupos que se obtienen mediante ambos enfoques. Algoritmos o métodos de agrupación Existen muchas formas de combinar los objetos. Ninguno de los métodos proporciona una solución óptima a todos los problemas, ya que es posible llegar a distintos resultados según el método elegido por el investigador. En general, se suele distinguir entre métodos jerárquicos y no jerárquicos (también denominados iterativos). Los primeros van agrupando o dividiendo los grupos sin tener que determinarse a priori el número de grupos final. Estos procedimientos se clasifican, a su vez, en aglomerativos (se agrupan los casos en grupos hasta que se forma un único grupo) y en divisivos (parte del grupo total y lo corta en grupos hasta llegar a cada caso concreto). Si se utilizan métodos no jerárquicos, se debe dar una solución a priori en cuanto al número de grupos que se forman. El primer paso del método aglomerativo consiste en considerar cada caso como un grupo distinto. Después se combinan dos de los casos en un sólo grupo, un tercer caso se añade al cluster o se combina con otro para formar un cluster distinto. Así pues, en cada paso, un caso individual se añade a 5 Por ejemplo, Dillon, Mullani y Frederick (1989) demuestran que al aplicar un análisis de componentes principales y elegir sólo aquellos factores que explican mayor varianza, se eliminan dos factores que sirven para determinar las mayores diferencias entre los estilos de vida de distintos grupos de personas pertenecientes a la tercera edad. Gómez Suárez. Mónica los clusters ya existentes o se combina con otro para formar un nuevo cluster. Una vez formado el cluster, ya no se puede cortar, sólo se puede combinar con otros clusters. En general hay tres tipos de submétodos dentro del aglomerativo: 1. Métodos de encadenamiento 2. Métodos de varianza 3. Métodos centroides6 Los métodos jerárquicos divisivos se han utilizado menos en las ciencias sociales, fundamentalmente por la inexistencia de programas que permitieran realizar el análisis de los datos. Entre los algoritmos más conocidos se puede citar el de Howard-Harris, que forma grupos, por división de otros de tamaño mayor, de modo también secuencial, utilizando el criterio de minimización de la varianza intragrupos en cada nivel de la división (Santesmases, 1997). Las principales desventajas asociadas a la utilización de los métodos jerárquicos son: - La dificultad de determinar a priori el mejoralgoritmo cuando el investigador desconoce la estructura de la muestra y - La inestabilidad de las soluciones que se aprecia cuando el tamaño muestral es reducido y/o hay presencia de casos atípico (outliers). En cuanto a los métodos no jerárquicos, el más utilizado es el k-means. Su principal inconveniente se deriva de que, a menudo, no se sabe cuál es el número de grupos que debe haber. Sin embargo, las soluciones se ven menos afectadas por la existencia de casos atípicos. La solución que suelen dar los expertos en cuanto a la elección del método de agrupación es la de combinar ambos tipos de algoritmos en dos etapas: primero determinar el número de grupos mediante un método jerárquico y, una vez definida la mejor solución en cuanto a número de grupos, utilizar un algoritmo no jerárquico7. Asimismo, se debe considerar la medida de distancia o similitud utilizada8. Determinación del número de grupos La literatura ofrece diferentes criterios que pueden ayudar al investigador a tomar la decisión relativa al número óptimo de grupos a formar. Cuando se aplica un método jerárquico, el criterio más frecuentemente utilizado es la observación del dendrograma (representación gráfica del proceso de agrupación). También se acude a la observación del coeficiente de aglomeración (valor numérico en el que se une varios casos que forman un nuevo grupo), bien mediante gráficos (coeficiente en un eje y número de casos en otro), bien mediante la utilización de medidas matemáticas que expresan los cambios incrementales en el coeficiente9. Otra forma de obtener los grupos se consigue mediante el ajuste global obtenido con cada grupo y la mejora experimentada en dicho ajuste con un grupo adicional10. Por último, la existencia de una teoría previa puede facilitar la determinación de los grupos sin basarse en una medida gráfica o estadística. Validación de los grupos 6 Ver Anexo 1 7 Si se desea ver una comparación entre los métodos de agrupación jerárquicos y no jerárquicos se puede consultar a Bigné, Miquel y otros (1997, pág.276). 8 Ver anexo 2 9 Las medidas que se suelen utilizar se basan en la homogeneidad dentro del grupo en relación a la heterogeneidad entre grupos. Existen hasta treinta índices distintos desarrollados por distintos expertos, siendo los más eficientes el de Calinski y Harabatz, el Je(2)/Je(1), el índice C y el índice de Beale (Milligan y Cooper, 1985). 10 El criterio de parada es el siguiente (Flavián y Polo, 1997, pág.110): 1.) El porcentaje de la varianza intragrupo explicado con cada agrupación debe superar el 60%. 2.) El incremento del porcentaje en la explicación de la varianza intra con la inclusión de un nuevo grupo en cada etapa debe ser superior al 5%. EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... En este caso, se trata de determinar tanto la fiabilidad como la validez de las soluciones que se han alcanzado. En cuanto a la fiabilidad, se debe probar que los resultados son consistentes, utilizando distintos algoritmos de agrupación y distintos métodos que muestren la inexistencia de multicolinealidad. Asímismo, se puede demostrar la fiabilidad partiendo la muestra de tal forma que una mitad sirva para definir los grupos y la otra para probar su consistencia. Sin embargo, muchas veces es difícil acudir a esta medida porque las muestras son muy pequeñas. Si se ha demostrado la fiabilidad, aún queda por probar la validez, tanto externa (la solución sobre la muestra es representativa de la población) como interna (es útil para predecir resultados). En cuanto a la validez externa, se debe acudir a una muestra parecida de la población que determine los mismos resultados. Respecto a la interna, se deben utilizar contrastes estadísticos que permitan establecer la consistencia de la solución. Normalmente se acude al análisis de la varianza o a otra técnica multivariante como el análisis discriminante11. A lo largo del epígrafe hemos puesto de manifiesto que la mayoría de estos aspectos dependen del juicio del investigador, ya que ni los mismos expertos en la técnica se ponen de acuerdo en cuanto a su utilización. No obstante, siempre se pueden emplear métodos alternativos y comprobar su consistencia y validez. En el siguiente epígrafe, expondremos la metodología seguida para practicar el estudio de los procedimientos más extendidos en la aplicación del análisis cluster al maketing, tanto a nivel internacional, como en España. 3. PROCESO DE REVISION DE LA LITERATURA 3.1. Metodología La revisión de la literatura acerca de la aplicación del cluster al marketing se ha llevado a cabo en dos etapas. La primera ha consistido en evaluar de forma numérica los trabajos publicados a nivel internacional entre 1986-1997, basándonos en el examen de las principales bases de datos de revistas y tesis extranjeras. En la segunda fase, nos centramos en una revisión profunda de la bibliografía publicada en España, limitándonos al período 1990-1997, ya que la mayoría de los trabajos han ido apareciendo desde principios de la década actual. La revisión bibliográfica a nivel internacional efectuada se apoya en las bases de datos en formato CD-ROM, en concreto ABI-INFORM, ECONLIT y UMI (tesis doctorales). La principal desventaja de utilizar como referencia estas bases de datos es que se centran en fuentes anglosajonas, fundamentalmente estadounidenses, apenas considerando publicaciones europeas. En cuanto a los trabajos a nivel nacional, al no existir una base de datos completa sobre revistas españolas, hemos revisado exclusivamente las publicaciones más frecuentes sobre temas de marketing, concretamente, ESIC Market, Distribución y Consumo, Revista Europea de Dirección y Economía de la Empresa, Información Comercial Española, Investigación y Marketing y Revista Española de Investigación de Marketing. Debemos reconocer, por tanto, el sesgo que hemos introducido en esta investigación al no tener en cuenta otras publicaciones. La otra fuente bibliográfica de obligada referencia son las actas de los encuentros de Profesores de Marketing. Respecto a las tesis doctorales, consultamos la base de datos TESEO. 3.2. Análisis de resultados a nivel internacional Las primeras revisiones que se realizaron en el área de Marketing sobre la utilización del análisis cluster se basaron en la construcción estadística de los algoritmos de agrupación, llegando a concluir que algunos de ellos eran bastante limitados (Sherman y Seth, 1977; Frank y Green, 1968). Posteriormente, las revisiones obviaron la parte más estadística y se centraron en la aplicación de la técnica. Una de las 11 Existen otras técnicas aparte del anova o discriminante como los que sugieren Klastorin (1983) o Punj y Stewart (1983), aunque estas dos técnicas son las más utilizadas. Gómez Suárez. Mónica revisiones metodológicas más consistentes es la de Punj y Stewart (1983), cuyo objetivo consiste en clarificar el empleo del cluster, facilitando unas recomendaciones específicas al usuario de la técnica. Concretamente, la revisión abarca la naturaleza de los datos, el algoritmo utilizado y su descripción, así como los principales programas de ordenador que permiten aplicar el cluster. El objetivo de nuestro artículo es determinar cómo se está utilizando el cluster en nuestro país, de ahí que sólo nos centremos en el número de publicaciones internacionales y no en su revisión analítica. Por ello, en este apartado acudimos a la metodología de palabras clave con el fin de determinar cuantas publicaciones y cómo ha sido la evolución numérica de aplicación del análisis cluster. Los resultados de este análisis se presentan en el cuadro 1. Desde mediados de los años ochenta (primeros artículos que aparecen en las base de datos) hasta la actualidad se han publicado 77 artículos en las principales revistasde marketing, fundamentalmente en el European Journal of Marketing, en el Journal of the Academy of Marketing Science (con 11 en cada una de las revistas), en el Journal of Advertising Research (10) y en el Journal of Marketing Research (8). Asimismo, las tesis doctorales que se han valido de la técnica de cluster superan el centenar (106 tesis). CUADRO 1 Número de publicaciones que aplican análisis cluste r a nivel internacional PUBLICACIONES 1986-89 1990-93 1994-97 TOTAL JOURNAL OF MARKETING 1 2 0 3 EUROPEAN JOURNAL OF MARKETING 3 6 2 11 JOURNAL OF MARKETING RESEARCH 3 2 3 8 MARKETING & RESEARCH TODAY 0 1 2 3 INTERNATIONAL JOURNAL OF ADVERTISING 2 1 2 5 JOURNAL OF ADVERTISING 0 0 0 0 JOURNAL OF ADVERTISING RESEARCH 5 4 1 10 INTERNATIONAL JOURNAL OF RETAIL & DISTRIBUTION MANAGEMENT 0 2 1 3 JOURNAL OF CONSUMER RESEARCH 1 2 0 3 JOURNAL OF PROFESSIONAL SERVICES MARKETING 1 2 0 3 JOURNAL OF PUBLIC POLICY & MARKETING 1 2 0 3 JOURNAL OF THE ACADEMY OF MARKETING SCIENCE 5 6 0 11 JOURNAL OF THE MARKETING RESEARCH SOCIETY 0 0 3 3 MARKETING MANAGEMENT 1 1 1 3 MARKETING SCIENCE 1 2 0 3 SALES & MARKETING MANAGEMENT 1 0 0 1 JOURNAL OF RETAILING 3 2 1 6 TOTAL REVISTAS 28 35 16 79 TOTAL TESIS DOCTORALES 29 54 23 106 TOTAL DE TRABAJOS 57 89 39 185 La conclusión más relevante cuando se analiza el cuadro es que la aplicación de la técnica objeto de nuestro estudio disfrutó de un período de introducción bastante largo, fundamentalmente debido a la incorporación paulatina de programas de software que permitían realizar el análisis cluster y al acceso de investigadores a esos programas estadísticos, siendo su aplicación notable a finales de los ochenta y principios de los 90. Desde 1994 los investigadores han ido reduciendo su utilización12. Nos debemos preguntar porqué el empleo de esta técnica ha disminuido de forma tan significativa. En nuestra opinión, entre las posibles explicaciones al fenómento detectado, destacan: 12 Hemos considerado que debíamos agrupar en períodos de cuatro años, después de llevar a cabo un análisis previo de cada año de revisión. Desde 1990 a 1997, se ha pasado de 20 a 5 publicaciones. EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... i comprensión de las limitaciones de la técnica, sobre todo, la subjetividad inherente a su aplicación e interpretación. ii. sustitución por otras técnicas más completas que se han ido utilizando con más profusión, al ser incluidas en los programas estadísticos como el CHAID o los modelos de ecuaciones estructurales. 3.3. Resultados de la revisión bibliográfica en España La revisión que hemos realizado en España es mucho más profunda, pues con ella tratamos de demostrar cómo se está aplicando la técnica del cluster a partir de los puntos que hemos considerado clave, ya descritos en el apartado 2. En concreto, estos aspectos son el método de determinación de variables, su estandarización y su agrupación en factores, el algoritmo de agrupación, la forma de determinación del número de grupos, la validación de los resultados, el programa de ordenador utilizado y el tema de marketing en el que se pueden encuadrar las investigaciones. Los resultados de esta revisión se pueden observar en el cuadro 2. Respecto a la selección de variables, el método más utilizado ha sido una combinación entre inductivo y cognitivo (25 estudios que suponen el 49% del total). También se acude con frecuencia al método deductivo (35%). Este resultado pone de manifiesto que aunque casi la mitad de los estudios tienen un carácter exploratorio, la teorías existentes sobre el tema que se está investigando son abundantes y permiten seleccionar las variables que sirven para configurar los análisis. Resulta llamativo el dato sobre el bajo número de estudios que estandarizan las variables (9 de 51, lo que supone un 17% del total). Asimismo, 20 (39%) de los 51 estudios examinados han procedido a realizar un factorial previo, utilizando las cargas como input de información para el cluster. Tanto la estandarización como la utilización de las cargas factoriales tienen detractores y defensores entre los expertos. Sin embargo, es importante que los investigadores comprueben la influencia de la multicolinealidad, así como el solapamiento de las variables con unidades de medida grandes. Por tanto, nosotros recomendamos que se prueben las distintas soluciones que se obtienen al aplicar ambas medidas, puesto que demostrarán la consistencia de la solución. Sobre todo, en cuanto a la correlación existente entre las variables es conveniente que se indique en los artículos alguna medida que demuestre si ésta puede influir en la agrupación. En cuanto a los algoritmos de agrupación se observa que el método más preferido ha sido el no jerárquico (43%) frente a la combinación de métodos (24%) o los métodos jerárquicos (19%). Debemos destacar además que un 17% de los estudios no especifican qué procedimiento de agrupación se ha utilizado. Creemos que la preferencia por el método no jerárquico (fundamentalmente K-means), se debe a que en su momento la capacidad de memoria de los ordenadores no facilitaba el uso de un método alternativo, sobre todo con grandes archivos, de tal forma que los investigadores sólo podían aplicar esta técnica. De hecho, se puede ver que al avanzar en el tiempo se ha ido sustituyendo la utilización de k- means por métodos combinados. La combinación preferida ha sido la aplicación conjunta del método de Ward con k-means, determinando con el primer algoritmo el número de grupos y empleando después los grupos obtenidos con el método no jerárquico. Respecto al método de Ward se debe advertir que tiende a sobrevalorar a los casos atípicos (outliers), lo cual suele influir en la solución final. Por ello, y como en el caso anterior, nuestra recomendación es que se utilicen varios métodos que permitan demostrar la validez de la solución obtenida. Gómez Suárez. Mónica CUADRO 2 Resumen de los aspectos relacionados con la aplicac ión del análisis cluster Nº Estudios Porcentaje 1. Selección de variables 1.1. Método Inductivo Deductivo Inductivo/Cognitivo 1.2. Análisis factorial previo 1.3. Estandarización de las variables 8 18 25 20 9 15.6 35.2 49.0 39.2 17.6 2. Algoritmos de agrupación 2.1. Jerárquicos Completo Ward Howard-Harris Entre grupos Otros 2.2. No jerárquicos 2.3. Combinación 2.4. No especifican 10 4 2 2 1 1 22 10 9 19.6 40.0 20.0 20.0 10.0 10.0 43.1 23.8 17.6 3. Determinación del número de grupos 3.1. Múltiples métodos 3.2. Método simple 3.3. Otros procedimientos 3.4. No especifican 7 11 9 24 13.7 21.6 17.6 47.1 4. Validación de los grupos 4.1. Fiabilidad 4.2. Validez No especifican Discriminante Anova-Manova Discriminante/Anova 9 21 11 17 2 17.6 41.2 21.6 33.3 3.9 5. Programa estadístico 5.1. SPSS 5.2. BMDP 5.3. Galaxy 5.4. Dyane 5.5. Systab 5.6. Spad 5.7. No especifican 33 1 3 2 1 3 8 64.7 2.0 5.9 3.9 2.0 5.9 15.7 6. Tipos de análisis 6.1. Grupos estratégicos 6.2. Segmentación 6.3. Otros 11 17 23 21.6 33.3 45.1 6. Tema de marketing 6.1. Comportamiento del consumidor 6.2. Comunicación 6.3. Distribución 6.4. Producto-servicio 6.5. Marketing de servicios 6.6. Otros 9 4 12 2 19 5 18.0 8.0 24.0 4.0 38.0 10.0 1 Elaboración propia basada en la revisión de los artículos publicados en las revistas. En este sentido, la mejor estrategia consiste en seguir un procedimiento basado en dos etapas (Punj y Stewart, 1983). En la primera se puede utilizar un método jerárquico que nos ayude a decidir el número de grupos a identificar, los centroides y los casos atípicos que deben ser eliminados. Los casos restantes serán objeto de iteraciones partitivasmediante un método no jerárquico aplicado con posterioridad (ver figura 1). EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... FIGURA 1 Proceso de elección del número de grupos METODO JERARQUICO SOLUCION PRELIMINAR 1. Nº GRUPOS 2. OBTENCION DE CENTROIDES 3.ELIMINACION DE ATIPICOS METODO NO JERARQUICO SOLUCION FINAL La determinación del número de grupos es quizá uno de los puntos más débiles de todas las investigaciones realizadas, puesto que el 47% de los estudios no especifican cómo han llegado a obtener los grupos. Los que sí lo hacen utilizan un sólo método, normalmente la observación del dendrograma, con lo que las agrupaciones que se realizan tienen una alta dosis de subjetividad, dependiendo en gran medida del juicio del investigador. Creemos que la utilización de distintos procedimientos puede ayudar a determinar cuál es el número de grupos idóneo. Asimismo, estimamos conveniente que en el futuro los investigadores especifiquen tanto el algoritmo de agrupación como la forma en que han determinado el número de clusters. También las indicaciones sobre la validación de la técnica es un aspecto a resaltar en esta revisión, ya que sólo el 17% de los estudios muestran la fiabilidad, existiendo además 21 investigaciones (41%) que no se preocupan de demostrar la validez. Quizá resulta difícil probar la fiabilidad a través de cortes en la muestra, ya que muchas veces estas muestras son pequeñas, pero sí se pueden aplicar distintos métodos de agrupación que nos ayuden a mostrar la fiabilidad. Respecto a la validez externa ningún estudio ha tratado de generalizar los datos a la población, por las dificultades que este procedimiento conlleva. No obstante, creemos que no es tan difícil probar la validez de criterio mediante la aplicación de contrastes estadísticos u otras técnicas multivariantes que muestren la consistencia de los resultados. De las 30 investigaciones que prueban dicha validez, la técnica más utilizada es el análisis de la varianza (33%), seguida del análisis discriminante (21%) o la combinación de ambas (4%). La utilización o preferencia por determinados algoritmos de agrupación está condicionada por los programas de ordenador con los que se analiza la información. El programa más usado es el SPSS Gómez Suárez. Mónica (64%), seguido muy de lejos por el SPAD y el Galaxy (3 investigaciones cada uno). Ocho investigaciones no especifican el paquete estadístico. Estos trabajos tampoco mencionan el algoritmo de agrupación, debiendo el lector confiar en el juicio del autor sobre las decisiones tomadas al aplicar esta técnica y no pudiendo replicar posteriormente los resultados de la investigación. Por último, hemos tratado de sintetizar en la tabla 2 los temas prioritarios en las investigaciones que han empleado el cluster. Como primer dato importante, destacamos que el 33% de los estudios se ha centrado en segmentación y el 21% en grupos estratégicos, sobre todo, dentro del sector bancario. Desagregando por temas, el marketing de servicios (38%), la distribución (24%) y el comportamiento del consumidor (18%) son las áreas de aplicación donde esta técnica se ha desarrollado con más profusión. 4. APLICACION DEL ANALISIS CLUSTER En este apartado se procederá a ilustrar la aplicación del análisis cluster siguiendo los pasos que se han especificado a lo largo del artículo. Para ello, se han utilizado los datos que provienen de los anuarios de la Asociación Española de Banca y de las Confederación Española de Cajas de Ahorros en relación a una serie de partidas de Balance que sirven para especificar unos ratios de patrón de especialización en el sistema bancario respecto a una muestra representativa de bancos y cajas instalados en España. Este análisis es similar al de grupos estratégicos, aunque en este caso sólo nos centraremos en una de las dimensiones (actividad en productos-mercado) con el objetivo de simplificar la aplicación de la técnica. Se ha realizado mediante el paquete estadístico SPSS 6.1. La selección de las variables se ha basado en un método inductivo-cognitivo, puesto que se han obtenido a partir de trabajos anteriormente publicados sobre grupos estratégicos en el sistema bancario español13. Estas variables, que son ratios compuestos de las partidas de balance, se presentan en el cuadro 3. Todas ellas, sirven para discriminar la actuación de las entidades en el mercado respecto a su especialización en éste, representando la mayor o menor propensión hacia la actividad mayorista o minorista. CUADRO 3 Variables seleccionadas Tesorería/Inversiones Financieras Participaciones en Empresas/Intermediarios Financieros de Activo Cartera de Valores/Intermediarios Financieros de Activo Depósitos/Recursos Ajenos Otras Cuentas/Recursos Ajenos Valores Negociables/Recursos Ajenos Intermediarios Financieros de Pasivo/Pasivo Total Hemos probado los dos métodos jerárquicos a los que más acuden los investigadores (Ward y Completo) y uno no jerárquico que, combinados con la selección de variables y con la utilización de factores, proporcionan los siguientes modelos alternativos: CUADRO 4 Aplicaciones alternativas del análisis cluster 1. Omitiendo una variable significativa 2. Método de Ward con factores 3. Método completo con factores 4. Método de Ward con variables simples 5. Método completo con variables simples 6. Método k-means con variables simples y centros desconocidos 7. Método k-means con variables simples y centros conocidos (procedentes de la aplicación del método 13 Gual y Vives (1991), Espitia, Polo y Salas (1991), Martínez (1996) y Mas (1996). EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... de Ward En primer lugar, hemos eliminado una de las variables que consideramos más significativas para diferenciar entre entidades (depósitos/recursos ajenos) con el fin de comprobar cómo cambia la agrupación respecto a la aplicación que incorpora todas las variables. Los dendrogramas obtenidos omitiendo una variable muy significativa muestran agrupaciones bastante diferentes a las obtenidas con todas las variables, tanto mediante el método de Ward como con el completo. Este sencillo ejercicio demuestra que la omisión de una variable importante pueden conducir a conclusiones erróneas y, en consecuencia, se recomienda al investigador que preste especial atención a la fase de selección de variables a incluir en el estudio, ya que los resultados alcanzados son altamente sensibles a la decisión adoptada (ver anexo). Al emplear ratios, se eliminan las unidades de medida y por tanto, la estandarización no es necesaria, ya que produce los mismos resultados respecto a la agrupación que las variables no tipificadas. Sin embargo, si llevamos a cabo un análisis factorial, se pueden obtener distintas agrupaciones. Así, al aplicar el análisis de componentes principales con rotación varimax se extraen dos factores que explican el 67.8% de la varianza del modelo y que agrupan por un lado a las variables que indican una actividad más o menos tradicional, tanto en activo como en pasivo14, y por otro a las variables que se relacionan con el mercado de valores y la participación directa en empresas15. Lógicamente, al perder casi un 30% en la explicación de la varianza, se elimina información importante a la hora de determinar el comportamiento de las entidades. Para observar la estabilidad de las soluciones y disponer de criterios válidos para decidir sobre el modelo con o sin factores, desarrollamos dos cluster mediante dos algoritmos de agrupación distintos empleando los factores como variables de agrupación (ver anexo). Los dendrogramas obtenidos resultan ser muy diferentes para cada uno de los métodos siendo la composición de los grupos distinta cuando se utiliza Ward o completo. Por esta razón, tomamos la decisión de aplicarel análisis a las variables por separado que, como luego mostraremos, produce soluciones más consistentes. En efecto, los dendrogramas que se obtienen al aplicar el análisis sobre las variables originales de forma alternativa con el método completo y el de Ward son muy parecidos. La diferencia entre ambos está en la composición de las agrupaciones cuando se eligen tres grupos, ya que con cuatro la composición es la misma con ambos métodos. Con tres grupos, un conglomerado de ocho bancos se sitúa en una posición distinta cuando se utiliza un método u otro. Sin embargo, si se observan los dendrogramas (ver anexo), el método completo determina una agrupación menos homogénea entre los componentes de cada grupo que el de Ward. Por tanto, elegimos este último método para seguir con nuestra aplicación. Hemos acudido a tres tipos de medidas para determinar el número de grupos. En primer lugar, la observación de los dendrogramas. En segundo lugar, la construcción del grafico de aglomeración y por último, la elaboración de un índices que se basa en la varianza de las agrupaciones. Mediante todas estas medidas, se puede constatar cuál es la agrupación más adecuada. En efecto, las medidas gráficas muestran que el conglomerado produce grupos más homogéneos entre sí y más heterogéneos respecto a los demás grupos. Los dendrogramas se pueden observar en el anexo y el gráfico de aglomeración en la figura 5. Este gráfico muestra en abscisas el número de grupos y en ordenadas el coeficiente de aglomeración que se obtiene al unir cada caso a un nuevo grupo. La pendiente de la curva que se puede formar con todos los puntos cambia de forma muy considerable cuando tenemos cuatro conglomerados, lo que unido al dendrograma y a la siguiente medida analítica que comentaremos nos hace concluir sobre el número más adecuado de grupos 14 Inversiones financieras/pasivo, depósitos/recursos ajenos, tesorería/inversiones financieras y otras cuentas/recursos ajenos. 15 Participaciones en empresas/intermediarios financieros, valores negociables/recursos ajenos y cartera de valores/intermediarios financieros. Gómez Suárez. Mónica FIGURA 2 Gráfico de aglomeración COEFICIENTE 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 Nº GRUPOS COEFICIENTE CUADRO 5 Indice determinantes del número de grupos 2 GRUPOS 3 GRUPOS 4 GRUPOS 5 GRUPOS INTRA 1.426 0.856 0.643 0.529 MEDIA 0.825 0.640 0.548 0.586 ENTRE 0.387 0.547 0.721 0.145 Nº GRUPOS 2 3 4 5 F-G 0.409 0.846 0.739 El índice utilizado ha sido el de Frey y Van Groenewound, ya que el coeficiente cúbico de aglomeración (citado por Ketchen y Hook de forma específica en su artículo) sólo se puede calcular a través del programa SAS. El numerador del índice se calcula como la diferencia entre la media de las distancias intra cluster para los dos niveles de la jerarquía y el denominador como la diferencia entre la media de las distancias inter cluster para los dos niveles. El ratio debe ser inferior a 1, eligiéndose aquella agrupación que proporcione un índice superior (Milligan y Cooper, 1985). Una vez determinado el número de grupos mediante el método de Ward a las variables originales, hemos comparado los resultados obtenidos con los procedentes de realizar una agrupación por el método k-means (no jerárquico), puesto que la solución que éste manifieste es más estable que la que ofrece el método de Ward. La agrupación es la misma cuando se utilizan los centros obtenidos a partir de este último método que cuando se tienen centros desconocidos. Por tanto, la clasificación final de las entidades es la siguiente: CUADRO 6 Composición de los grupos por entidades GRUPO 1 (Banca minorista) GRUPO 2 (Banca Universal) GRUPO 3 (Banca minorista- empresas) GRUPO 4 (Banca mayorista) Popular Herrero Asturias Caja Madrid Ibercaja Bancaja Unicaja Inmaculada Sabadell Laietana BBV Central Hispano Banesto Santander Catalana Bankinter Barclays BNP España San Paolo Credit Lyonnais Guipuzcoano Urquijo Mapfre Banpyme Europa Caixa Cataluña Barclays Tokyo Sumitomo América Exterior Midland Napoli EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... Por último, para probar la validez de la agrupación, ya que la fiabilidad ha sido constatada con la obtención de los mismos grupos al emplear distintos métodos en la solución de cuatro grupos16, hemos aplicado otras tres técnicas de análisis: discriminante, anova y manova. La primera muestra que la matriz clasifica correctamente el 97% de los casos, ya que únicamente falla en un caso del cuarto grupo. El manova y el análisis de la varianza muestran que la solución es significativa en su conjunto y para cada variable por separado. En cuanto al MANOVA el valor del lambda de Wilks es de 19,93 con un nivel de significación del 1%. Respecto al ANOVA y el Discriminante sus resultados se pueden observar en el cuadro 7. CUADRO 7 Validez de la agrupación mediante anova y discriminante VARIABLES (ANOVA) F Tesorería/Inversiones Financieras 38.19** Participaciones en Empresas/Intermediarios Financieros de Activo 7.84** Cartera de Valores/Intermediarios Financieros de Activo 4.36* Depósitos/Recursos Ajenos 171.25** Otras Cuentas/Recursos Ajenos 6.05** Valores Negociables/Recursos Ajenos 5.43* Intermediarios Financieros de Pasivo/Pasivo Total 85.79** GRUPOS (DISCRIMINANTE) % Exito en clasificación Grupo 1 100% Grupo 2 100% Grupo 3 100% Grupo 4 87.5% PORCENTAJE GRPOS CLASIFICADOS CORRECTAMENTE 97.06% ** Significativo al 1% * Significativo al 5% 5. CONCLUSIONES El análisis cluster es un método estadístico de clasificación que no necesita acudir a supuestos previos sobre la pertenencia a un grupo por parte de la población. Es un método empírico puro, por lo que puede ayudar al desarrollo de la ciencia del marketing cuando el objetivo primario de la investigación es clasificar consumidores, productos u organizaciones. No obstante, esta técnica debe aplicarse con prudencia para que su validez sea plena. En concreto, su utilización tiene que ceñirse a unas normas que se basan, sobre todo, en el uso conjunto de varios métodos alternativos y de apoyo. En este artículo hemos puesto de manifiesto que muchas de las investigaciones realizadas en España hasta el momento no han cumplido parte de los requisitos inherentes a la aplicación del cluster. Muchas de ellas no mencionan los algoritmos de agrupación o cómo se determina el número de grupos. Asimismo, no se prueba, en la mayoría de los casos, la fiabilidad y la validez de las soluciones. Esta falta de especificación o de prueba impide la repetición de los resultados en investigaciones posteriores y ofrece poca ayuda respecto al procedimiento a utilizar por otros investigadores (Punj y Stewart, 1983). Asimismo, hemos demostrado mediante una aplicación práctica, cómo se debe utilizar esta técnica. 16 La muestra es muy pequeña como para que se pueda cortar en dos grupos. Gómez Suárez. Mónica El trabajo aquí presentado pretende facilitar la tarea de los investigadores que se plantean utilizar el cluster por primera vez o ayudar a perfeccionar su uso en el caso de que se haya aplicado con anterioridad, puesto que pese a sus inconvenientes es la única técnica que nos permite clasificar a priori una serie de objetos o sujetos, siendo la clasificación el primer y último paso de la investigación científica. BILIOGRAFIA AGUDO, A. y FERNANDEZ, J.M. (1994), “Métodos de segmentación basados en la aplicación combinada de técnicas estadísticas”, VI Encuentro de Profesores Universitarios de Marketing, San Sebastian, pp.99-107. BARNEY, J.B. y HOSKINSON, R.E. (1990). “Strategic groups: untested assertions and researchproposals”, Managerial Decision Economics, Vol.11, pp.187-198. BEERLI, A. y GARCIA, J.M. (1992). “La segmentación del mercado y su aplicación al mercado bancario minorista”, Información Comercial Española, nº707, pp.143-151. BEERLI, A. y RODRIGUEZ, A. (1994). “El comportamiento del mercado de productos de confección textil: hacia una tipología de sus consumidores”, VI Encuentro de Profesores Universitarios de Marketing, San Sebastian, pp.382-394. BIGNE, E. (1990). “El análisis cluster: una aplicación a las áreas de interés en de las agencias de publicidad”, Esic-Market, nº69, pp.7-28. BIGNE, E., VALLET, T., MOLINER, M. y SANCHEZ, J. (1996), “La satisfacción de usuarios de servicios públicos hospitalarios”, VIII Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.231-240. BISQUERRA, R. (1989). Introducción conceptual al análisis multivariable: un enfoque infromático con los paquetes SPSS-X, BMDP, LISREL y SPAD, Vol. II, Barcelona, Promociones y Publicaciones Universitarias. CALOMARDE, J.V. (1991). “El análisis cluster aplicado a la segmentación del comportamiento de compra por variables ecológicas”. III Encuentro de Profesores Universitarios de Marketing. Salamanca, pp.317-345. CALORMARDE, J.V. (1992). “Actitudes ante el medio ambiente y centros de interés social”, IV Encuentro de Profesores Universitarios de Marketing, El Escorial. CALORMARDE, J.V. (1995). “Actitudes ante el medio ambiente y centros de interés social”, Esic- Market, nº89, pp.125-154. CALOMARDE, J.V., GARCIA, B. y MARTINEZ, E. (1997). “La influencia de los factores ecológicos en las decisiones de marketing empresarial: el sector del papel y del cartón”, IX Encuentro de Profesores Universitarios de Marketing, Murcia, pp.43-64. CAMARERO, C. y MARTIN, N. (1995). “La comunicación ecológica de las empresas: un estudio empírico”, VII Encuentro de Profesores Universitarios de Marketing, Barcelona, pp. 99-109. CAMARERO, C., GUTIERREZ, I. y RODRIGUEZ, I. (1996). “Insatisfacción, comportamiento de queja e intención de recompra: un estudio exploratorio (el caso de la educación universitaria)”, VIII Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.43-54. CESPEDES, J.J. (1996). “Grupos estratégicos en la banca privada española”, Información Comercial Española, nº753, pp.106-124. EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... CESPEDES, J.J. y SANCHEZ, M. (1996). “Tendencias y desarrollos recientes en métodos de investigación y análisis de datos en dirección de empresas”, Revista Europea de Dirección y Economía de la Empresa, Vol.5, nº3, pp.23-40. DILLON, W.R., MULANI, N. y FREDERICK, D.G. (1989). “On the use of componenet scores in the presence of group structure”, Journal of Consumer Research, Vol.16, pp.106-112. DIAZ, A. RIO, B., SANTOS, L. y SANZO, M.J. (1996). “Los valores sociales del consumidor: un estudio para el mercado del automóvil”, VIII Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.30-41. ESPITIA, M., POLO, Y. y SALAS, V. (1991). “Grupos estratégicos y resultados en el sector bancario español”, Información Comercial Española, nº690, pp.189-212. ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1994). “Análisis del comportamiento de la demanda turística española procedente de Europa”, VI Encuentro de Profesores Universitarios de Marketing, San Sebastian, pp. 470-478. ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1994). “Análisis del comportamiento de la demanda turística española procedente de Europa”, Esic-Market, nº85, pp.183-197. ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1995). “Análisis comparativo del comportamiento: la demanda turística del primer trimestre de 1994-1995”, VII Encuentro de Profesores Universitarios de Marketing, Barcelona, pp. 503-512. FLAVIAN, C. y POLO, Y. (1997). “Los grupos estratégicos como herramienta de análisis de la competencia en el sector detallista español”, Esic-Market, nº96, pp.9-28. FLAVIAN, C. y POLO, Y. (1997). “Identificación de patrones de comportamiento estratégico en la gran distribución española”, Información Comercial Española, nº763, pp.99-117. FONT, B. (1996). “Los procedimientos de análisis cluster aplicados a la distribución comercial”, Esic-Market, nº94, pp.73-83. FRASQUET, M. y MOLLA, A. (1997). “Variedad en el comportamiento de la clientela en centros comerciales”, Información Comercial Española, nº763, pp.138-150. FUENTES, F., BARRIO, S. y SANCHEZ, J. (1997). “Importancia de los atributos calidad/precio en el proceso de decisión del consumidor granadino”, IX Encuentro de Profesores Universitarios de Marketing, Murcia, pp.171-183. FUNKHOUSER, G.R. (1983). “A note on the reability of certain clustering algorithms”, Journal OF Marketing Research, Vol.20, pp.99-102. GARCIA, J.M. y RODRIGUEZ, M. (1996). “Grupos estratégicos en el sector del comercio textil: una metodología fundamental en las variables del retailing-mix”, Información Comercial Española, nº750, pp.133-152. GOMEZ, M. (1997). “Estrategias de distribución en banca de empresas”, IX Encuentros de Profesores Universitarios de Marketing, Murcia, pp.185-201. GOMEZ, M. y MENDEZ, J.L. (1993). “Imagen y posicionamiento de entidades financieras en la CAM”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.269-279. Gómez Suárez. Mónica GRANDE, I. y ABASCAL, E. (1993). “Criterios de elección de establecimiento comercial: el caso de la tercera edad”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.171-180. GREEN, P.E., FRANK, R.E. y ROBINSON, P.J. (1967). “Cluster analysis in test market selection”, Management Science, Vol.13, pp.387-400. GUAL, J. y VIVES, X. (1990). Concentración empresarial y competitividad: España en la CEE, Barcelona, Ariel. GUAL, J. y VIVES, X. (1991). Ensayos sobre el sector bancario español, Madrid, FEDEA. HAIR, J.H., ANDERSON, R.E., TATHAM, R.L. Y BLACK,W.C. (1995). Multivariate data analysis with readings, New Jersey, Prentice Hall, 4ª Edición. HERNANDEZ, M., MUNUERA, J.L. y RUIZ DE MAYA, S. (1995). “La estrategia de diferenciación en el comercio minorista”, Información Comercial Española, nº739, pp.27-45. IGLESIAS, V. (1995). “Tipos de variables y emtodología a emplear en la identificación de grupos estratégicos: una aplicación empírica al sector detallista”, Revista Europea de Dirección y Economía de la Empresa, Vol.3, nº3, pp.73-86. IGLESIAS, V. y RUIZ, A. “El análisis de las estrategias de marketing en el comercio minorista”, Información Comercial Española, nº763. JIMENEZ, A. y VARGAS, M. (1995). “El efecto de la satisfacción en la lealtad de la marca”, VII Encuentro de Profesores Universitarios de Marketing, Barcelona, pp.271-281. KLASTORIN, T.D. (1983). “Assesing cluster analysis resaults”Journal of Marketing Research, Vol.XX, pp.92-98. KETCHEN, D.J. y SHOOK, C.L. (1996). “The application of cluster analysis in strategic management research: an analysis and critique”, Strategic Management Journal, Vol.17, pp.441-458. KINNEAR, T.C. y TAYLOR, (1996). Marketing research: an applied approach, 5ª Ed., New York, McGraw-Hill. LUQUE, T. y CORDON, E. (1994). “Una aplicación del análisis multivariable a las características socio-económicas y comerciales de las capitales de provincia españolas”, Revista Europea de Dirección y Economía de la Empresa, Vol.3, nº1, pp.101-112. LUQUE, T., FRIAS, D. y MARAVER, G. (1994). “Las escuelas de marketing y los encuentros de profesores universitarios”. VI Encuentro de Profesores Universitarios de Marketing, San Sebastian, pp.13-25. LUQUE, T., SANCHEZ, G. y FRIAS, D. (1995). “La innovación en el mercado farmaceútico español”, Revista Europea de Dirección y Economía de la Empresa, Vol.4, nº1, pp.47-58. MARTINEZ VILCHES, R. (1992). Grupos estratégicos en el sector de Cajas de Ahorros Españolas, Caja de Ahorros y Monte de Piedad de Madrid. MAS RUIZ, F.(1991). “Análisis de la competencia en Cajas de Ahorros:grupos estratégicos”. III Encuentro de Profesores Universitarios de Marketing. Salamanca, pp.260-263. MAS RUIZ, F. (1996). Competencia y dinámica de grupos estratégicos: aplicación al sector bancario español. Universidad de Alicante. EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... MAS RUIZ, F. y GOMEZ SALA, J. (1992). “Identificación de los grupos estratégicos en las Cajas de Ahorros españolas”, Revista Europea de Dirección y Economía de la Empresa, Vol.1, nº3, pp.9-28. MAS RUIZ, F. y GOMEZ SALA, J. (1993). “Análisis de la competencia en cajas de ahorros: grupos estratégicos”. Esic-Market, nº79, pp.143-167. MENDEZ, J.L. (1992). “La actitud de los consumidores frente a las formas comerciales: resultados de una investigación sobre hábitos de compra”, Distribución y Consumo, nº4, pp.47-53. MEYER, A.D. (1991). “What is strategy’s distinctive competence?”, Academy of Management Journal, Vol.36, pp.1175-1195. MILLIGAN, G.W. y COOPER, M.C. (1985). “An examination of procedures for determining the number of clusters in a data set”, Psychometrika, Vol.50, nº2, pp.59-179. MIQUEL, S. y BIGNE, E. (1992). “Un análisis cluster del sector hotelero español”, IV Encuentro de Profesores Universitarios de Marketing, El Escorial. MIQUEL, S., BIGNE, E., LEVY, J.P., CUENCA, A. y MIQUEL, M.J. (1997). Investigación de mercados, Madrid, McGraw-Hill. MOLINER, M.A., VALLET, T. Y SANCHEZ, J. (1994). “Percepción y posicionamiento de los servicios públicos. Una aplicación a la ciudad de Castellón”, VI Encuentro de Profesores Universitarios de Marketing, San Sebastian, pp.153-163. MORRISON, D.G. (1967). “Measurement problems in cluster analysis”, Management Science, Vol.13, pp.775-780. MUNUERA, J.L., RUIZ DE MAYA, S., FERNANDEZ, M. y MAS RUIZ, F. (1993). Información Comercial Española, nº718, pp.119-138. MUÑIZ, N. (1996). “Evolución de los grupos estratégicos en la distribución comercial europea”, VIII Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.326-338. MUÑOZ, P. (1993). “Estrategias de posicionamiento en las empresas de distribución comercial”, Distribución y Consumo, nº10, pp.46-57. NARROS, M.J. (1993). “Métodos de segmentación de mercado: un estudio comparativo aplicado a las audiencia de radio”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.539-552. NARROS, M.J. (1994). “Métodos de segmentación de mercado: un estudio comparativo aplicado a las audiencia de radio”, Esic-Market, nº87, pp.53-67. ONIS, T. y RIALP, J. (1996). “La elección de una universidad: el caso concreto de la UAB”, VIII Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.93-102. PENELAS, A. (1992).”Generación de estrategias naturales en el marketing bancario”, IV Encuentro de Profesores Universitarios de Marketing, El Escorial. PUNJ, G. y STEWART, D.W. (1983). “Cluster analysis in Marketing Research. Review and suggestions for application”, Journal of Marketing Research, Vol.20, pp.134-148. RODRIGUEZ, I. TRESPALACIOS, J. Y VAZQUEZ, R. (1994). “La actitud como determinante del grado de satisfacción de un servicio”, VI Encuentro de Profesores Universitarios de Marketing, San Sebastian, pp. 413-423. Gómez Suárez. Mónica RODRIGUEZ, I. TRESPALACIOS, J. Y VAZQUEZ, R. (1994). “La actitud como determinante del grado de satisfacción de un servicio”, Esic-Market, nº85, pp.157-170. RUIZ, A. (1993). “Segmentación del mercado financiero de economías familiares: un estudio empírico”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.291-306. RUIZ, A. (1997). “Segmentación del mercado financiero de economías familiares: un estudio empírico”, Esic-Market, nº97, pp.9-41. RUIZ, A., GONZALEZ, F. e IGLESIAS, V. (1996). “Comercialización de un producto indiferenciado: la gasolina en España”, VIII Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.311-325. SANTESMASES, M. (1997). Dyane: diseño y análisis de encuestas en investigación social y de mercados. Madrid, Pirámide. SCHUMAN, A. (1967), “Letter to the editor”. Management Science, Vol.13, pp.688-696. THOMAS, H. y VENKATRAMAN, N. (1988). “Research on strategic groups: progress and prognosis”, Journal of Management Studies, Vol.25, pp.537-555. TRESPALACIOS, J., RIO, A. e IGLESIAS, V. (1997). “Dimensiones de la orientación al mercado y sus efectos sobre las empresas del sector agroalimentario”, IX Encuentros de Profesores Universitarios de Marketing, Murcia, pp.428-443. VAZQUEZ, R., RODRIGUEZ, I. y RUIZ, A. (1995). “Calidad de servicio y su percepción por el consumidor: aplicación a las empresas detallistas”, VII Encuentro de Profesores Universitarios de Marketing, Barcelona, pp.415-431. EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... ANEXO DEFINICIONES METODOS DE AGRUPACION Todos los métodos se basan o bien en la matriz de distancias o bien en la de similitudes mediante pares de casos. Los métodos difieren en la manera en que estiman las semejanzas o diferencias entre los clusters en los pasos sucesivos. Debido a que la unión de cada paso depende de la medida de distancia o similitud, se pueden dar distintas soluciones para el mismo método. Uno de los métodos menos complejos es el encadenamiento simple, llamado también vecino más cercano. Primero se combinan los dos casos con menos distancia o más similitud entre ellos. La distancia entre el nuevo cluster y los casos individuales se calcula como la mínima distancia entre el caso individual y un caso del cluster. En cada paso, la distancia entre dos cluster es la que existe entre sus dos puntos más cercanos. El encadenamiento completo o técnica del vecino más lejano se basa en lo contrario, de tal forma que la distancia entre dos clusters se calcula como la existente entre sus puntos más lejanos. El UPGMA o encadenamiento medio entre grupos define la distancia entre dos clusters como la media de las distancias entre todos los pares de casos en que cada miembro del par proviene de un cluster diferente. Sólo considera, pues, las distancias entre pares de casos de diferentes clusters. Al tener en cuenta la información de todas las distancias entre pares de individuos, no solamente de los más alejados o de los más próximos, suele ser uno de los métodos más utilizados. Una variante de este método es el encadenamiento medio intra grupos, en el cual se combinan los grupos de tal forma que la distancia promedio entre todos los casos del cluster resultante sea los más pequeña posible. Uno de los métodos más usados es el de Ward. Calcula la media de todas las variables de cada cluster. Luego calcula la distancia euclídea al cuadrado entre cada individuo y la media de su grupo. Se suman después las distancias de todos los casos y en cada paso, los clusters que se forman son aquellos que resultan con el menor incremento en la suma total de las distancias intra-cluster. El método del centroide calcula la distancia entre dos clusters como la distancia entre sus medias para todas las variables. Una desventaja de este método es que la distancia en que los clusters se combinan puede decrecer de un paso a otro, de ahí que los clusters que se unen en las últimas etapas sean menos parecidos a los que se unen en las primeras, propiedad poco deseable. MEDIDAS DE DISTANCIA Y SIMILITUD La proximidad se mide a través de la distancia o de la similitud. Ambas miden la proximidad entre dos objetos o dos sujetos, pero la distancia se utiliza para variables cuantitativas y la similitud mide la cercanía entre dos sujetos u objetos en función de unas variables cualitativas. En el cluster los objetos se agrupan según su cercanía, es decir por su mayor similitud o su menor distancia.Hay diferentes medidas de distancia y similitud. La selección de la medida de distancia debería basarse tanto en sus propiedades como medida como en el algoritmo de formación del cluster. Se debe saber que distintas medidas de proximidad puedendar resultados distintos para los mismos datos. Una de las medidas mas usadas es la euclidiana al cuadrado, que se define como la raiz de la suma de las diferencias al cuadrado de todas las variables.Las medidas de similitud se realizan sobre escalas nominales y se calculan comparando las filas de datos para el i-ésimo y j-ésimo individuo en base a una tabla de asociación. Las medidas de distancia sirven para medir la proximidad entre variables numéricas. La más utilizada es la distancia euclidea, aunque también se pueden utilizar la distancia absoluta, la D de Mahalanovis -que se basa en la matriz de covarianzas, entre otras. Gómez Suárez. Mónica Dendrogram using Ward Method Rescaled Dista nce Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+- --------+---------+---------+ IBERCAJA 15 BANCAJA 30 HERRERO 13 LAIETANA 28 UNICAJA 27 CA SABADELL 29 POPULAR 12 INMACULADA 16 CAJAMADRID 14 ASTURIAS 26 MAPFRE 32 BANPYME 33 URQUIJO 17 BARCLAYS, S.A.E. 31 CAIXA 19 CA CATALUÐA 20 GUIPUZCOANO 18 EUROPA 34 BBV 1 BCH 2 SANTANDER 3 BNP ESPAÐA 21 BANESTO 5 CATALANA 6 SAN PAOLO DI TORINO 23 ZARAGOZANO 7 CREDIT LYONNAIS 22 BANKINTER 4 BEX 8 AMERICA 9 SUMITOMO 10 TOKYO 24 MIDLAND 11 NAPOLI 25 Dendrogram using Complete Linkage Rescaled Dista nce Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+- --------+---------+---------+ IBERCAJA 15 BANCAJA 30 HERRERO 13 LAIETANA 28 UNICAJA 27 CA SABADELL 29 POPULAR 12 INMACULADA 16 CAJAMADRID 14 ASTURIAS 26 BANESTO 5 CATALANA 6 SAN PAOLO DI TORINO 23 CREDIT LYONNAIS 22 ZARAGOZANO 7 BBV 1 BCH 2 BNP ESPAÐA 21 SANTANDER 3 BANKINTER 4 MAPFRE 32 BANPYME 33 URQUIJO 17 BARCLAYS, S.A.E. 31 CAIXA 19 CA CATALUÐA 20 GUIPUZCOANO 18 EUROPA 34 BEX 8 AMERICA 9 SUMITOMO 10 TOKYO 24 MIDLAND 11 NAPOLI 25 Dendrogram using Ward Method Rescaled Dista nce Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+- --------+---------+---------+ IBERCAJA 20 BANCAJA 26 UNICAJA 23 CA SABADELL 25 HERRERO 18 GUIPUZCOANO 28 LAIETANA 24 CAIXA 29 CA CATALUÐA 30 POPULAR 17 INMACULADA 21 CAJAMADRID 19 ASTURIAS 22 EUROPA 34 MAPFRE 32 BANPYME 33 BBV 1 BCH 2 BNP ESPAÐA 8 CREDIT LYONNAIS 9 SANTANDER 3 BANESTO 5 CATALANA 6 SAN PAOLO DI TORINO 10 ZARAGOZANO 7 URQUIJO 27 BARCLAYS, S.A.E. 31 BANKINTER 4 BEX 11 AMERICA 12 MIDLAND 14 SUMITOMO 13 TOKYO 15 NAPOLI 16 Dendrogram using Complete Linkage Rescaled Dista nce Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+- --------+---------+---------+ IBERCAJA 20 BANCAJA 26 UNICAJA 23 CA SABADELL 25 HERRERO 18 GUIPUZCOANO 28 LAIETANA 24 CAIXA 29 CA CATALUÐA 30 POPULAR 17 INMACULADA 21 CAJAMADRID 19 ASTURIAS 22 EUROPA 34 MAPFRE 32 BANPYME 33 URQUIJO 27 BARCLAYS, S.A.E. 31 BANKINTER 4 BNP ESPAÐA 8 CREDIT LYONNAIS 9 BANESTO 5 CATALANA 6 SAN PAOLO DI TORINO 10 ZARAGOZANO7 BBV 1 BCH 2 SANTANDER 3 BEX 11 AMERICA 12 MIDLAND 14 SUMITOMO 13 TOKYO 15 NAPOLI 16 DENDROGRAMA VARIABLES (WARD) DENDROGRAMA VARIABLES (COMPLETO) DENDROGRAMA SIN DEPOSITOS/REC.AJENOS DENDROGRAMA CON FACTORES
Compartir