Logo Studenta

preprintCLUSTERGomezESIC2002

¡Este material tiene más páginas!

Vista previa del material en texto

EL ANALISIS CLUSTER EN 
INVESTIGACIÓN DE 
MARKETING: METODOLOGIA 
Y CRITICA 
 
 
 
MONICA GOMEZ SUAREZ 
UNIVERSIDAD AUTONOMA DE MADRID1 
 
 
 
 
 
 
Resumen: 
 
En este trabajo se realiza un análisis crítico de la literatura sobre la aplicación de la técnica de cluster en 
marketing durante los años noventa. Para ello, se exponen en primer lugar una serie de pasos esenciales a 
seguir según los expertos cuando se aplica dicha técnica. A continuación se revisa el número de artículos 
y tesis doctorales escritos en el extranjero en el período 1987-1997, llevándose a cabo con posterioridad 
una análisis exhaustivo sobre la utilización del cluster en marketing dentro de nuestro país (1990-1997). 
Por último, se expone una aplicación práctica de la técnica que sigue los pasos anteriormente descritos. 
 
Summary 
 
This article presents an examination of the literature written about the application of the cluster analysis 
in marketing in the 90’s. First, we introduce the required steps when applying this technique in the 
experts point of view. Afterwards, the number of articles and dissertations publised abroad (1987-1997) 
is under review, studying as well the applicarion of cluster in marketing in Spain (1990-1997). Finally, 
there is a exposition about the practical use of the technique, which follows the steps described before. 
 
 
1 Dpto. Financiación e Investigación Comercial. Facultad de CC.Empresariales. UAM. 28049 
CANTOBLANCO. MADRID. Tfno: (91)3974348. 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
1. INTRODUCCION 
 
 El desarrollo informático ha extendido la aplicación en el área de marketing de distintas técnicas de 
análisis de datos con gran complejidad estadística. Entre los procedimientos más empleados se 
encuentran el análisis factorial, la regresión múltiple, el análisis discriminante múltiple y el análisis 
cluster. 
 
 El objetivo principal de esta última técnica multivariante es la búsqueda de grupos u objetos 
relativamente homogéneos. Su nombre se utiliza para definir una serie de técnicas que tienen por objeto 
la búsqueda de grupos similares de individuos o de variables que se van agrupando en conglomerados. Si 
tenemos una muestra de individuos, de cada uno de los cuales se dispone de una serie de observaciones, 
el análisis cluster sirve para clasificarlos en grupos lo más homogéneos posible en base a las variables 
observadas2. 
 
 El origen de esta técnica multivariante se encuentra en la biología y la botánica, debido a que los 
investigadores de estas áreas de conocimiento tenían la necesidad de agrupar las distintas especies de 
animales y vegetales conocidas, en familias que fueran lo más homogéneas posibles (Miquel, Bigné y 
otros, 1997, p.268). La variedad de nombres con los que se denomina a esta técnica se debe precisamente 
a su utilización en muy diversas disciplinas, tales como la psicología, la sociología, la economía o la 
ingeniería. A pesar de ello, todos los métodos desarrollados tienen una dimensión común: clasificar de 
acuerdo con la relación natural que existe entre los sujetos u objetos (Hair, Anderson y otros, 1995). El 
análisis cluster se conoce desde hace varias décadas. En los años 30 se desarrollaron algunas tímidas 
aplicaciones, aunque comenzó a adquirir verdadero auge fue en los años 50. 
 
 Las aplicaciones del análisis cluster al marketing han sido múltiples, aunque, lógicamente, el campo 
donde mayores niveles de aplicación alcanza y donde más beneficios ofrece es el de la segmentación de 
mercados. También se ha utilizado en la identificación de hábitos de compra, de grupos de productos 
competitivos, valoración de productos de competidores o identificación de localidades que serán usadas 
posteriormente como mercados de prueba. En los últimos años, se ha revelado como la técnica más 
utilizada en el análisis de grupos estratégicos y en el desarrollo de tipologías estratégicas, casi siempre en 
combinación con otras técnicas multivariantes, como el análisis factorial y el análisis de la varianza. 
 
 Sin embargo, el uso del análisis cluster también ha sido objeto de numerosos ataques, tanto dentro de 
la investigación de marketing como de la dirección estratégica (Green, Frank y Robinson, 1967; 
Morrison, 1967; Schuman, 1967; Funkhouser, 1983; Ketchen y Shook, 1996; Barney y Hoskisson, 1990; 
Meyer, 1991), fundamentalmente por los siguientes aspectos: 
 
i. La excesiva confianza que se deposita en el juicio del investigador al aplicar esta 
técnica, ya que, a diferencia de otros métodos, el cluster no ofrece un contraste 
estadístico que facilite una respuesta concreta sobre la confirmación o no de los 
resultados que sirven de apoyo a las hipótesis planteadas en la investigación. 
 
ii. Muchas aplicaciones del análisis cluster no se han basado en una racionalidad teórica. A 
menudo, las dimensiones o variables parecen haberse seleccionado al azar y los grupos 
que se identifican no reflejan condiciones reales sino que son simples “artificios 
estadísticos supeditados a variaciones númericas aleatorias entre organizaciones” 
(Thomas y Venkatraman, 1988). De ahí que con la utilización del cluster se asuma un 
 
2 La palabra "cluster", que define estas técnicas, se podría traducir como grupo, conglomerado, racimo, apiñarse. En 
general, en todos los paquetes estadísticos se conserva su nombre inglés, aunque también se conoce como análisis de 
conglomerados, taxonomía numérica, análisis tipológico o clasificación automática. El cluster se puede utilizar de 
dos formas muy distintas: clasificación o representación de estructuras de datos. El primer objetivo -clasificación- es 
la más común de las aplicaciones (Punj y Stewart, 1983). Por esta razón, el artículo se centra en el cluster como 
forma de clasificación. 
Gómez Suárez. Mónica 
 
notable grado de riesgo de ofrecer clasificaciones inexactas, sino imponiendo grupos 
que realmente no existen. 
 
iii. La escasa fiabilidad que algunos autores atribuyen a determinados algoritmos de 
agrupación (Funkhouser, 1983). 
 
 Incluso algunos autores han afirmado que esta técnica es un “estigma metodológico” (Meyer, 1991) 
cuestionando su valor como método aplicado a la investigación, debido a los resultados equívocos a los 
que lleva a veces su utilización (por ejemplo, en la configuración de grupos estratégicos, donde no se ha 
demostrado de forma consistente la relación entre la pertenencia a un grupo y los resultados). 
 
 A pesar de esta controversia, el análisis cluster sigue siendo una de las técnicas multivariantes más 
utililizadas por los investigadores de marketing en nuestro país. Por esta razón, el propósito de este 
artículo es analizar su aplicación actual dentro de esta disciplina en España, haciendo primero un breve 
repaso de la situación a nivel internacional. Nuestro objetivo no es sólo evaluar su uso en el pasado, sino 
también configurar unas líneas maestras que guíen la investigación mediante su aplicación en el futuro, 
para poder hacer posible su mejor utilización. 
 
 Para ello, en este trabajo, describimos que aspectos son críticos en la metodología de una 
investigación cuando se utiliza el cluster. Posteriormente, analizamos numéricamente la evolución de las 
publicaciones basadas en la aplicación de esta técnica a nivel internacional dentro del marketing. A 
continuación, realizamos una revisión metodológica en profundidad de los artículos y ponencias 
publicados en España en los años 90 en las principales revistas y congresos relacionados con esta 
disciplina. Por último, a través de una aplicación práctica y como resultado de la comparación entre las 
prácticas existentes y las que proponemos, ofrecemos una serie de recomendaciones que ayuden a los 
investigadores de marketing a maximizar el valor del análisis cluster. El objetivo de este artículo no es 
analizar, sin embargo, las primeras aplicaciones en el ámbitodel marketing ni hacer un resumen de su 
gestación como técnica, sino estudiar la utilización en su época de consolidación. 
 
2. ASPECTOS CONCEPTUALES Y CRITICOS 
 
 En este epígrafe exponemos los principales aspectos relacionados con la aplicación del análisis 
cluster. No tratamos de ofrecer, sin embargo, una explicación detallada de todos los puntos específicos 
que acompañan a la aplicación de esta técnica (algoritmos, medidas de distancia, etc), puesto que éstos 
ya aparecen en una serie de publicaciones anteriores3, tanto dentro como fuera del área de marketing. No 
resulta muy difícil agrupar estos aspectos, ya que la mayoría de los expertos han destacado varios de 
ellos. Sí es una tarea más complicada determinar cuál debe ser la metodología correcta pues, en la 
mayoría de los casos, estos mismos expertos no han llegado a un acuerdo. 
 
 Como primera medida, hemos determinado una serie de puntos esenciales por los que cualquier 
investigador debe optar al aplicar esta técnica. Al no existir un consenso sobre qué elección es la mejor 
en algunas ocasiones, el investigador debe analizar las fuerzas o debilidades de un determinado enfoque 
y elegir áquel que resulte más conveniente a la hora de aportar objetividad a la investigación que 
desarrolla. Estos puntos esenciales al aplicar el análisis cluster son: la selección de variables, los 
algoritmos o métodos de agrupación, la determinación del número de grupos y la validación de los 
resultados4. 
 
Selección de variables 
 
 
3 Por ejemplo, Klastorin (1983), Punj y Stewart (1983), Bisquerra (1989), Noururis (1993), Hair y otros (1995), 
Kinnear y Taylor (1996), Miquel, Bigné y otros (1997). 
4 El esquema que seguimos se basa en el artículo publicado por Ketchen y Shook en el Strategic Management 
Journal en 1996. Dicho artículo analizaba todos las investigaciones sobre estrategia publicadas en las seis 
revistas prestigiosas de management (Academy of Management Journal, Journal of International Business 
Studies, Journal of Management, Management Science y Strategic Management Journal) desde 1977 hasta 1993. 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
 La selección de variables que se incluyen en el análisis es una paso crucial, ya que si se excluyen 
variables importantes éste será insuficiente y pobre. En el cluster, la selección inicial de variables 
determina las características que se usarán para identificar los grupos. Existen fundamentalmente tres 
métodos de selección de variables: inductivo, deductivo y cognitivo. El primero, en el que ni las 
variables ni el número de grupos que se espera obtener tienen un nexo con una teoría, es el que más se 
utiliza en estudios exploratorios. El segundo se apoya en la literatura teórica preexistente. A diferencia 
del anterior, la consistencia interna de los grupos es mayor, ya que no se incluyen variables irrelevantes 
que disminuyen la validez de las agrupaciones resultantes. El método congnitivo está muy cercano, en la 
práctica, al inductivo, ya que no se basa en apreciaciones teóricas (hipótesis), sino que utiliza las 
predicciones de determinados expertos de la industria para definir las variables (Ketchen y Shook, 1996). 
 
 La selección de variables basada en uno de estos tres métodos depende de los objetivos de la 
investigación. Si existe una teoría previa, se debe confirmar mediante la utilización de las variables que 
facilita. No obstante, en muchas ocasiones, los estudios realizados en el campo del marketing son 
exploratorios y, por tanto, se debe recurrir a un enfoque inductivo o cognitivo. Si tenemos acceso a las 
opiniones de expertos, es recomendable considerarlas, ya que de esta forma aumentaremos la 
probabilidad de que las variables reflejen fielmente la realidad. 
 
 La estandarización de las variables y la utilización de factores que provienen de un análisis factorial 
previo son también dos aspectos que se deben tratar en este epígrafe. Al utilizar diferentes unidades de 
medida en las distintas variables, áquellas que se midan con grandes números solaparán a las que se 
miden con números pequeños. Para resolver este problema se pueden estandarizar las variables aunque 
no siempre es la mejor estrategia, ya que el proceso de estandarización permite que las variables 
contribuyan de igual forma a la definición de los grupos, pero también puede eliminar diferencias 
significativas entre los elementos de análisis (Funkhouser, 1983). Debido a que no hay un consenso entre 
los expertos en cuanto a la estandarización o no de las variables, la mejor estrategia es emplear ambos 
enfoques (estandarización y no estandarización). Si la solución no es consistente, entonces se debe mirar 
la validez de los resultados de cada uno de ellos y elegir áquel cuya solución aporte mayor confianza. 
 
 En cuanto a la utilización de factores que provienen de una análisis factorial previo, se pretende 
eliminar con ella la multicolinealidad entre variables. También la utilización de factores, en vez de 
variables, ha suscitado controversias entre los investigadores, ya que al emplear sólo los factores que 
tienen mayor autovalor se puede eliminar información que pueda ser importante a la hora de diferenciar 
entre los individuos5. En este caso, ocurre como con la estandarización, se debe determinar el impacto 
que tiene la utilización de los factores o de las variables por separado en la consistencia de los grupos 
que se obtienen mediante ambos enfoques. 
 
Algoritmos o métodos de agrupación 
 
 Existen muchas formas de combinar los objetos. Ninguno de los métodos proporciona una 
solución óptima a todos los problemas, ya que es posible llegar a distintos resultados según el método 
elegido por el investigador. En general, se suele distinguir entre métodos jerárquicos y no jerárquicos 
(también denominados iterativos). Los primeros van agrupando o dividiendo los grupos sin tener que 
determinarse a priori el número de grupos final. Estos procedimientos se clasifican, a su vez, en 
aglomerativos (se agrupan los casos en grupos hasta que se forma un único grupo) y en divisivos (parte 
del grupo total y lo corta en grupos hasta llegar a cada caso concreto). Si se utilizan métodos no 
jerárquicos, se debe dar una solución a priori en cuanto al número de grupos que se forman. 
 
 El primer paso del método aglomerativo consiste en considerar cada caso como un grupo 
distinto. Después se combinan dos de los casos en un sólo grupo, un tercer caso se añade al cluster o se 
combina con otro para formar un cluster distinto. Así pues, en cada paso, un caso individual se añade a 
 
5 Por ejemplo, Dillon, Mullani y Frederick (1989) demuestran que al aplicar un análisis de componentes 
principales y elegir sólo aquellos factores que explican mayor varianza, se eliminan dos factores que sirven para 
determinar las mayores diferencias entre los estilos de vida de distintos grupos de personas pertenecientes a la 
tercera edad. 
Gómez Suárez. Mónica 
 
los clusters ya existentes o se combina con otro para formar un nuevo cluster. Una vez formado el 
cluster, ya no se puede cortar, sólo se puede combinar con otros clusters. En general hay tres tipos de 
submétodos dentro del aglomerativo: 
 
1. Métodos de encadenamiento 
2. Métodos de varianza 
3. Métodos centroides6 
 
 Los métodos jerárquicos divisivos se han utilizado menos en las ciencias sociales, 
fundamentalmente por la inexistencia de programas que permitieran realizar el análisis de los datos. 
Entre los algoritmos más conocidos se puede citar el de Howard-Harris, que forma grupos, por 
división de otros de tamaño mayor, de modo también secuencial, utilizando el criterio de 
minimización de la varianza intragrupos en cada nivel de la división (Santesmases, 1997). 
 
 Las principales desventajas asociadas a la utilización de los métodos jerárquicos son: 
 
- La dificultad de determinar a priori el mejoralgoritmo cuando el investigador desconoce la 
estructura de la muestra y 
 
- La inestabilidad de las soluciones que se aprecia cuando el tamaño muestral es reducido y/o hay 
presencia de casos atípico (outliers). 
 
 En cuanto a los métodos no jerárquicos, el más utilizado es el k-means. Su principal inconveniente 
se deriva de que, a menudo, no se sabe cuál es el número de grupos que debe haber. Sin embargo, las 
soluciones se ven menos afectadas por la existencia de casos atípicos. 
 
 La solución que suelen dar los expertos en cuanto a la elección del método de agrupación es la de 
combinar ambos tipos de algoritmos en dos etapas: primero determinar el número de grupos mediante 
un método jerárquico y, una vez definida la mejor solución en cuanto a número de grupos, utilizar un 
algoritmo no jerárquico7. Asimismo, se debe considerar la medida de distancia o similitud utilizada8. 
 
Determinación del número de grupos 
 
 La literatura ofrece diferentes criterios que pueden ayudar al investigador a tomar la decisión 
relativa al número óptimo de grupos a formar. Cuando se aplica un método jerárquico, el criterio más 
frecuentemente utilizado es la observación del dendrograma (representación gráfica del proceso de 
agrupación). También se acude a la observación del coeficiente de aglomeración (valor numérico en 
el que se une varios casos que forman un nuevo grupo), bien mediante gráficos (coeficiente en un eje 
y número de casos en otro), bien mediante la utilización de medidas matemáticas que expresan los 
cambios incrementales en el coeficiente9. Otra forma de obtener los grupos se consigue mediante el 
ajuste global obtenido con cada grupo y la mejora experimentada en dicho ajuste con un grupo 
adicional10. Por último, la existencia de una teoría previa puede facilitar la determinación de los 
grupos sin basarse en una medida gráfica o estadística. 
 
Validación de los grupos 
 
6 Ver Anexo 1 
7 Si se desea ver una comparación entre los métodos de agrupación jerárquicos y no jerárquicos se puede 
consultar a Bigné, Miquel y otros (1997, pág.276). 
8 Ver anexo 2 
9 Las medidas que se suelen utilizar se basan en la homogeneidad dentro del grupo en relación a la 
heterogeneidad entre grupos. Existen hasta treinta índices distintos desarrollados por distintos expertos, siendo 
los más eficientes el de Calinski y Harabatz, el Je(2)/Je(1), el índice C y el índice de Beale (Milligan y Cooper, 
1985). 
10 El criterio de parada es el siguiente (Flavián y Polo, 1997, pág.110): 
1.) El porcentaje de la varianza intragrupo explicado con cada agrupación debe superar el 60%. 
2.) El incremento del porcentaje en la explicación de la varianza intra con la inclusión de un nuevo 
grupo en cada etapa debe ser superior al 5%. 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
 
 En este caso, se trata de determinar tanto la fiabilidad como la validez de las soluciones que se han 
alcanzado. En cuanto a la fiabilidad, se debe probar que los resultados son consistentes, utilizando 
distintos algoritmos de agrupación y distintos métodos que muestren la inexistencia de 
multicolinealidad. Asímismo, se puede demostrar la fiabilidad partiendo la muestra de tal forma que 
una mitad sirva para definir los grupos y la otra para probar su consistencia. Sin embargo, muchas 
veces es difícil acudir a esta medida porque las muestras son muy pequeñas. 
 
 Si se ha demostrado la fiabilidad, aún queda por probar la validez, tanto externa (la solución sobre 
la muestra es representativa de la población) como interna (es útil para predecir resultados). En cuanto 
a la validez externa, se debe acudir a una muestra parecida de la población que determine los mismos 
resultados. Respecto a la interna, se deben utilizar contrastes estadísticos que permitan establecer la 
consistencia de la solución. Normalmente se acude al análisis de la varianza o a otra técnica 
multivariante como el análisis discriminante11. 
 
 A lo largo del epígrafe hemos puesto de manifiesto que la mayoría de estos aspectos dependen del 
juicio del investigador, ya que ni los mismos expertos en la técnica se ponen de acuerdo en cuanto a 
su utilización. No obstante, siempre se pueden emplear métodos alternativos y comprobar su 
consistencia y validez. En el siguiente epígrafe, expondremos la metodología seguida para practicar el 
estudio de los procedimientos más extendidos en la aplicación del análisis cluster al maketing, tanto a 
nivel internacional, como en España. 
 
3. PROCESO DE REVISION DE LA LITERATURA 
 
3.1. Metodología 
 
 La revisión de la literatura acerca de la aplicación del cluster al marketing se ha llevado a cabo en 
dos etapas. La primera ha consistido en evaluar de forma numérica los trabajos publicados a nivel 
internacional entre 1986-1997, basándonos en el examen de las principales bases de datos de revistas 
y tesis extranjeras. En la segunda fase, nos centramos en una revisión profunda de la bibliografía 
publicada en España, limitándonos al período 1990-1997, ya que la mayoría de los trabajos han ido 
apareciendo desde principios de la década actual. 
 
 La revisión bibliográfica a nivel internacional efectuada se apoya en las bases de datos en formato 
CD-ROM, en concreto ABI-INFORM, ECONLIT y UMI (tesis doctorales). La principal desventaja de 
utilizar como referencia estas bases de datos es que se centran en fuentes anglosajonas, 
fundamentalmente estadounidenses, apenas considerando publicaciones europeas. 
 
 En cuanto a los trabajos a nivel nacional, al no existir una base de datos completa sobre revistas 
españolas, hemos revisado exclusivamente las publicaciones más frecuentes sobre temas de marketing, 
concretamente, ESIC Market, Distribución y Consumo, Revista Europea de Dirección y Economía de la 
Empresa, Información Comercial Española, Investigación y Marketing y Revista Española de 
Investigación de Marketing. Debemos reconocer, por tanto, el sesgo que hemos introducido en esta 
investigación al no tener en cuenta otras publicaciones. La otra fuente bibliográfica de obligada 
referencia son las actas de los encuentros de Profesores de Marketing. Respecto a las tesis doctorales, 
consultamos la base de datos TESEO. 
 
3.2. Análisis de resultados a nivel internacional 
 
 Las primeras revisiones que se realizaron en el área de Marketing sobre la utilización del análisis 
cluster se basaron en la construcción estadística de los algoritmos de agrupación, llegando a concluir que 
algunos de ellos eran bastante limitados (Sherman y Seth, 1977; Frank y Green, 1968). Posteriormente, 
las revisiones obviaron la parte más estadística y se centraron en la aplicación de la técnica. Una de las 
 
11 Existen otras técnicas aparte del anova o discriminante como los que sugieren Klastorin (1983) o Punj y 
Stewart (1983), aunque estas dos técnicas son las más utilizadas. 
Gómez Suárez. Mónica 
 
revisiones metodológicas más consistentes es la de Punj y Stewart (1983), cuyo objetivo consiste en 
clarificar el empleo del cluster, facilitando unas recomendaciones específicas al usuario de la técnica. 
Concretamente, la revisión abarca la naturaleza de los datos, el algoritmo utilizado y su descripción, así 
como los principales programas de ordenador que permiten aplicar el cluster. 
 
 El objetivo de nuestro artículo es determinar cómo se está utilizando el cluster en nuestro país, de ahí 
que sólo nos centremos en el número de publicaciones internacionales y no en su revisión analítica. Por 
ello, en este apartado acudimos a la metodología de palabras clave con el fin de determinar cuantas 
publicaciones y cómo ha sido la evolución numérica de aplicación del análisis cluster. Los resultados de 
este análisis se presentan en el cuadro 1. Desde mediados de los años ochenta (primeros artículos que 
aparecen en las base de datos) hasta la actualidad se han publicado 77 artículos en las principales revistasde marketing, fundamentalmente en el European Journal of Marketing, en el Journal of the Academy of 
Marketing Science (con 11 en cada una de las revistas), en el Journal of Advertising Research (10) y en 
el Journal of Marketing Research (8). Asimismo, las tesis doctorales que se han valido de la técnica de 
cluster superan el centenar (106 tesis). 
 
CUADRO 1 
Número de publicaciones que aplican análisis cluste r a nivel internacional 
 
PUBLICACIONES 1986-89 1990-93 1994-97 TOTAL 
JOURNAL OF MARKETING 1 2 0 3 
EUROPEAN JOURNAL OF MARKETING 3 6 2 11 
JOURNAL OF MARKETING RESEARCH 3 2 3 8 
MARKETING & RESEARCH TODAY 0 1 2 3 
INTERNATIONAL JOURNAL OF ADVERTISING 2 1 2 5 
JOURNAL OF ADVERTISING 0 0 0 0 
JOURNAL OF ADVERTISING RESEARCH 5 4 1 10 
INTERNATIONAL JOURNAL OF RETAIL & 
DISTRIBUTION MANAGEMENT 
0 2 1 3 
JOURNAL OF CONSUMER RESEARCH 1 2 0 3 
JOURNAL OF PROFESSIONAL SERVICES 
MARKETING 
1 2 0 3 
JOURNAL OF PUBLIC POLICY & MARKETING 1 2 0 3 
JOURNAL OF THE ACADEMY OF MARKETING 
SCIENCE 
5 6 0 11 
JOURNAL OF THE MARKETING RESEARCH SOCIETY 0 0 3 3 
MARKETING MANAGEMENT 1 1 1 3 
MARKETING SCIENCE 1 2 0 3 
SALES & MARKETING MANAGEMENT 1 0 0 1 
JOURNAL OF RETAILING 3 2 1 6 
TOTAL REVISTAS 28 35 16 79 
TOTAL TESIS DOCTORALES 29 54 23 106 
TOTAL DE TRABAJOS 57 89 39 185 
 
 La conclusión más relevante cuando se analiza el cuadro es que la aplicación de la técnica objeto de 
nuestro estudio disfrutó de un período de introducción bastante largo, fundamentalmente debido a la 
incorporación paulatina de programas de software que permitían realizar el análisis cluster y al acceso de 
investigadores a esos programas estadísticos, siendo su aplicación notable a finales de los ochenta y 
principios de los 90. Desde 1994 los investigadores han ido reduciendo su utilización12. 
 
 Nos debemos preguntar porqué el empleo de esta técnica ha disminuido de forma tan significativa. En 
nuestra opinión, entre las posibles explicaciones al fenómento detectado, destacan: 
 
 
12 Hemos considerado que debíamos agrupar en períodos de cuatro años, después de llevar a cabo un análisis 
previo de cada año de revisión. Desde 1990 a 1997, se ha pasado de 20 a 5 publicaciones. 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
i comprensión de las limitaciones de la técnica, sobre todo, la subjetividad inherente a su 
aplicación e interpretación. 
 
ii. sustitución por otras técnicas más completas que se han ido utilizando con más profusión, al ser 
incluidas en los programas estadísticos como el CHAID o los modelos de ecuaciones 
estructurales. 
 
3.3. Resultados de la revisión bibliográfica en España 
 
 La revisión que hemos realizado en España es mucho más profunda, pues con ella tratamos de 
demostrar cómo se está aplicando la técnica del cluster a partir de los puntos que hemos considerado 
clave, ya descritos en el apartado 2. En concreto, estos aspectos son el método de determinación de 
variables, su estandarización y su agrupación en factores, el algoritmo de agrupación, la forma de 
determinación del número de grupos, la validación de los resultados, el programa de ordenador utilizado 
y el tema de marketing en el que se pueden encuadrar las investigaciones. Los resultados de esta revisión 
se pueden observar en el cuadro 2. 
 
 Respecto a la selección de variables, el método más utilizado ha sido una combinación entre 
inductivo y cognitivo (25 estudios que suponen el 49% del total). También se acude con frecuencia al 
método deductivo (35%). Este resultado pone de manifiesto que aunque casi la mitad de los estudios 
tienen un carácter exploratorio, la teorías existentes sobre el tema que se está investigando son 
abundantes y permiten seleccionar las variables que sirven para configurar los análisis. 
 
 Resulta llamativo el dato sobre el bajo número de estudios que estandarizan las variables (9 de 51, lo 
que supone un 17% del total). Asimismo, 20 (39%) de los 51 estudios examinados han procedido a 
realizar un factorial previo, utilizando las cargas como input de información para el cluster. Tanto la 
estandarización como la utilización de las cargas factoriales tienen detractores y defensores entre los 
expertos. Sin embargo, es importante que los investigadores comprueben la influencia de la 
multicolinealidad, así como el solapamiento de las variables con unidades de medida grandes. Por tanto, 
nosotros recomendamos que se prueben las distintas soluciones que se obtienen al aplicar ambas 
medidas, puesto que demostrarán la consistencia de la solución. Sobre todo, en cuanto a la correlación 
existente entre las variables es conveniente que se indique en los artículos alguna medida que demuestre 
si ésta puede influir en la agrupación. 
 
 En cuanto a los algoritmos de agrupación se observa que el método más preferido ha sido el no 
jerárquico (43%) frente a la combinación de métodos (24%) o los métodos jerárquicos (19%). Debemos 
destacar además que un 17% de los estudios no especifican qué procedimiento de agrupación se ha 
utilizado. 
 
 Creemos que la preferencia por el método no jerárquico (fundamentalmente K-means), se debe a que 
en su momento la capacidad de memoria de los ordenadores no facilitaba el uso de un método 
alternativo, sobre todo con grandes archivos, de tal forma que los investigadores sólo podían aplicar esta 
técnica. De hecho, se puede ver que al avanzar en el tiempo se ha ido sustituyendo la utilización de k-
means por métodos combinados. La combinación preferida ha sido la aplicación conjunta del método de 
Ward con k-means, determinando con el primer algoritmo el número de grupos y empleando después los 
grupos obtenidos con el método no jerárquico. Respecto al método de Ward se debe advertir que tiende a 
sobrevalorar a los casos atípicos (outliers), lo cual suele influir en la solución final. Por ello, y como en 
el caso anterior, nuestra recomendación es que se utilicen varios métodos que permitan demostrar la 
validez de la solución obtenida. 
 
Gómez Suárez. Mónica 
 
CUADRO 2 
Resumen de los aspectos relacionados con la aplicac ión del análisis cluster 
 Nº Estudios Porcentaje 
1. Selección de variables 
1.1. Método 
Inductivo 
Deductivo 
Inductivo/Cognitivo 
1.2. Análisis factorial previo 
1.3. Estandarización de las variables 
 
 
 8 
18 
25 
20 
 9 
 
 
15.6 
35.2 
49.0 
39.2 
17.6 
2. Algoritmos de agrupación 
2.1. Jerárquicos 
Completo 
Ward 
Howard-Harris 
Entre grupos 
Otros 
2.2. No jerárquicos 
2.3. Combinación 
2.4. No especifican 
 
10 
 4 
 2 
 2 
 1 
 1 
22 
10 
 9 
 
19.6 
40.0 
20.0 
20.0 
10.0 
10.0 
43.1 
23.8 
17.6 
3. Determinación del número de grupos 
3.1. Múltiples métodos 
3.2. Método simple 
3.3. Otros procedimientos 
3.4. No especifican 
 
 7 
11 
 9 
24 
 
13.7 
21.6 
17.6 
47.1 
 
4. Validación de los grupos 
4.1. Fiabilidad 
4.2. Validez 
No especifican 
Discriminante 
Anova-Manova 
Discriminante/Anova 
 
 9 
 
21 
11 
17 
 2 
 
17.6 
 
41.2 
21.6 
33.3 
 3.9 
5. Programa estadístico 
5.1. SPSS 
5.2. BMDP 
5.3. Galaxy 
5.4. Dyane 
5.5. Systab 
5.6. Spad 
5.7. No especifican 
 
33 
1 
3 
2 
1 
3 
8 
 
64.7 
 2.0 
 5.9 
 3.9 
 2.0 
 5.9 
15.7 
6. Tipos de análisis 
6.1. Grupos estratégicos 
6.2. Segmentación 
6.3. Otros 
 
11 
17 
23 
 
21.6 
33.3 
45.1 
6. Tema de marketing 
6.1. Comportamiento del consumidor 
6.2. Comunicación 
6.3. Distribución 
6.4. Producto-servicio 
6.5. Marketing de servicios 
6.6. Otros 
 
 9 
 4 
12 
 2 
19 
 5 
 
18.0 
 8.0 
24.0 
 4.0 
38.0 
10.0 
 
1 Elaboración propia basada en la revisión de los artículos publicados en las revistas. 
 En este sentido, la mejor estrategia consiste en seguir un procedimiento basado en dos etapas (Punj y 
Stewart, 1983). En la primera se puede utilizar un método jerárquico que nos ayude a decidir el número 
de grupos a identificar, los centroides y los casos atípicos que deben ser eliminados. Los casos restantes 
serán objeto de iteraciones partitivasmediante un método no jerárquico aplicado con posterioridad (ver 
figura 1). 
 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
FIGURA 1 
Proceso de elección del número de grupos 
 
METODO 
 JERARQUICO 
 
 
SOLUCION PRELIMINAR 
 
 
1. Nº GRUPOS 
2. OBTENCION DE 
CENTROIDES 
3.ELIMINACION DE 
ATIPICOS 
 
 
 METODO NO 
 JERARQUICO 
 
 
 
SOLUCION 
FINAL 
 
 La determinación del número de grupos es quizá uno de los puntos más débiles de todas las 
investigaciones realizadas, puesto que el 47% de los estudios no especifican cómo han llegado a obtener 
los grupos. Los que sí lo hacen utilizan un sólo método, normalmente la observación del dendrograma, 
con lo que las agrupaciones que se realizan tienen una alta dosis de subjetividad, dependiendo en gran 
medida del juicio del investigador. Creemos que la utilización de distintos procedimientos puede ayudar 
a determinar cuál es el número de grupos idóneo. Asimismo, estimamos conveniente que en el futuro los 
investigadores especifiquen tanto el algoritmo de agrupación como la forma en que han determinado el 
número de clusters. 
 
 También las indicaciones sobre la validación de la técnica es un aspecto a resaltar en esta revisión, 
ya que sólo el 17% de los estudios muestran la fiabilidad, existiendo además 21 investigaciones (41%) 
que no se preocupan de demostrar la validez. Quizá resulta difícil probar la fiabilidad a través de cortes 
en la muestra, ya que muchas veces estas muestras son pequeñas, pero sí se pueden aplicar distintos 
métodos de agrupación que nos ayuden a mostrar la fiabilidad. Respecto a la validez externa ningún 
estudio ha tratado de generalizar los datos a la población, por las dificultades que este procedimiento 
conlleva. No obstante, creemos que no es tan difícil probar la validez de criterio mediante la aplicación 
de contrastes estadísticos u otras técnicas multivariantes que muestren la consistencia de los resultados. 
De las 30 investigaciones que prueban dicha validez, la técnica más utilizada es el análisis de la varianza 
(33%), seguida del análisis discriminante (21%) o la combinación de ambas (4%). 
 
 La utilización o preferencia por determinados algoritmos de agrupación está condicionada por los 
programas de ordenador con los que se analiza la información. El programa más usado es el SPSS 
Gómez Suárez. Mónica 
 
(64%), seguido muy de lejos por el SPAD y el Galaxy (3 investigaciones cada uno). Ocho 
investigaciones no especifican el paquete estadístico. Estos trabajos tampoco mencionan el algoritmo de 
agrupación, debiendo el lector confiar en el juicio del autor sobre las decisiones tomadas al aplicar esta 
técnica y no pudiendo replicar posteriormente los resultados de la investigación. 
 
 Por último, hemos tratado de sintetizar en la tabla 2 los temas prioritarios en las investigaciones 
que han empleado el cluster. Como primer dato importante, destacamos que el 33% de los estudios se 
ha centrado en segmentación y el 21% en grupos estratégicos, sobre todo, dentro del sector bancario. 
Desagregando por temas, el marketing de servicios (38%), la distribución (24%) y el comportamiento 
del consumidor (18%) son las áreas de aplicación donde esta técnica se ha desarrollado con más 
profusión. 
 
4. APLICACION DEL ANALISIS CLUSTER 
 
 En este apartado se procederá a ilustrar la aplicación del análisis cluster siguiendo los pasos que se 
han especificado a lo largo del artículo. Para ello, se han utilizado los datos que provienen de los 
anuarios de la Asociación Española de Banca y de las Confederación Española de Cajas de Ahorros 
en relación a una serie de partidas de Balance que sirven para especificar unos ratios de patrón de 
especialización en el sistema bancario respecto a una muestra representativa de bancos y cajas 
instalados en España. Este análisis es similar al de grupos estratégicos, aunque en este caso sólo nos 
centraremos en una de las dimensiones (actividad en productos-mercado) con el objetivo de 
simplificar la aplicación de la técnica. Se ha realizado mediante el paquete estadístico SPSS 6.1. 
 
 La selección de las variables se ha basado en un método inductivo-cognitivo, puesto que se han 
obtenido a partir de trabajos anteriormente publicados sobre grupos estratégicos en el sistema 
bancario español13. Estas variables, que son ratios compuestos de las partidas de balance, se presentan 
en el cuadro 3. Todas ellas, sirven para discriminar la actuación de las entidades en el mercado 
respecto a su especialización en éste, representando la mayor o menor propensión hacia la actividad 
mayorista o minorista. 
 
CUADRO 3 
Variables seleccionadas 
 
Tesorería/Inversiones Financieras 
Participaciones en Empresas/Intermediarios Financieros de 
Activo 
Cartera de Valores/Intermediarios Financieros de Activo 
Depósitos/Recursos Ajenos 
Otras Cuentas/Recursos Ajenos 
Valores Negociables/Recursos Ajenos 
Intermediarios Financieros de Pasivo/Pasivo Total 
 
 Hemos probado los dos métodos jerárquicos a los que más acuden los investigadores (Ward y 
Completo) y uno no jerárquico que, combinados con la selección de variables y con la utilización de 
factores, proporcionan los siguientes modelos alternativos: 
 
CUADRO 4 
Aplicaciones alternativas del análisis cluster 
1. Omitiendo una variable significativa 
2. Método de Ward con factores 
3. Método completo con factores 
4. Método de Ward con variables simples 
5. Método completo con variables simples 
6. Método k-means con variables simples y centros desconocidos 
7. Método k-means con variables simples y centros conocidos (procedentes de la aplicación del método 
 
13 Gual y Vives (1991), Espitia, Polo y Salas (1991), Martínez (1996) y Mas (1996). 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
de Ward 
 En primer lugar, hemos eliminado una de las variables que consideramos más significativas para 
diferenciar entre entidades (depósitos/recursos ajenos) con el fin de comprobar cómo cambia la 
agrupación respecto a la aplicación que incorpora todas las variables. Los dendrogramas obtenidos 
omitiendo una variable muy significativa muestran agrupaciones bastante diferentes a las obtenidas 
con todas las variables, tanto mediante el método de Ward como con el completo. Este sencillo 
ejercicio demuestra que la omisión de una variable importante pueden conducir a conclusiones 
erróneas y, en consecuencia, se recomienda al investigador que preste especial atención a la fase de 
selección de variables a incluir en el estudio, ya que los resultados alcanzados son altamente sensibles 
a la decisión adoptada (ver anexo). 
 
 Al emplear ratios, se eliminan las unidades de medida y por tanto, la estandarización no es 
necesaria, ya que produce los mismos resultados respecto a la agrupación que las variables no 
tipificadas. Sin embargo, si llevamos a cabo un análisis factorial, se pueden obtener distintas 
agrupaciones. Así, al aplicar el análisis de componentes principales con rotación varimax se extraen 
dos factores que explican el 67.8% de la varianza del modelo y que agrupan por un lado a las 
variables que indican una actividad más o menos tradicional, tanto en activo como en pasivo14, y por 
otro a las variables que se relacionan con el mercado de valores y la participación directa en 
empresas15. Lógicamente, al perder casi un 30% en la explicación de la varianza, se elimina 
información importante a la hora de determinar el comportamiento de las entidades. Para observar la 
estabilidad de las soluciones y disponer de criterios válidos para decidir sobre el modelo con o sin 
factores, desarrollamos dos cluster mediante dos algoritmos de agrupación distintos empleando los 
factores como variables de agrupación (ver anexo). Los dendrogramas obtenidos resultan ser muy 
diferentes para cada uno de los métodos siendo la composición de los grupos distinta cuando se utiliza 
Ward o completo. Por esta razón, tomamos la decisión de aplicarel análisis a las variables por 
separado que, como luego mostraremos, produce soluciones más consistentes. 
 
 En efecto, los dendrogramas que se obtienen al aplicar el análisis sobre las variables originales de 
forma alternativa con el método completo y el de Ward son muy parecidos. La diferencia entre ambos 
está en la composición de las agrupaciones cuando se eligen tres grupos, ya que con cuatro la 
composición es la misma con ambos métodos. Con tres grupos, un conglomerado de ocho bancos se 
sitúa en una posición distinta cuando se utiliza un método u otro. Sin embargo, si se observan los 
dendrogramas (ver anexo), el método completo determina una agrupación menos homogénea entre los 
componentes de cada grupo que el de Ward. Por tanto, elegimos este último método para seguir con 
nuestra aplicación. 
 
 Hemos acudido a tres tipos de medidas para determinar el número de grupos. En primer lugar, la 
observación de los dendrogramas. En segundo lugar, la construcción del grafico de aglomeración y 
por último, la elaboración de un índices que se basa en la varianza de las agrupaciones. Mediante 
todas estas medidas, se puede constatar cuál es la agrupación más adecuada. En efecto, las medidas 
gráficas muestran que el conglomerado produce grupos más homogéneos entre sí y más heterogéneos 
respecto a los demás grupos. Los dendrogramas se pueden observar en el anexo y el gráfico de 
aglomeración en la figura 5. Este gráfico muestra en abscisas el número de grupos y en ordenadas el 
coeficiente de aglomeración que se obtiene al unir cada caso a un nuevo grupo. La pendiente de la 
curva que se puede formar con todos los puntos cambia de forma muy considerable cuando tenemos 
cuatro conglomerados, lo que unido al dendrograma y a la siguiente medida analítica que 
comentaremos nos hace concluir sobre el número más adecuado de grupos 
 
14 Inversiones financieras/pasivo, depósitos/recursos ajenos, tesorería/inversiones financieras y otras 
cuentas/recursos ajenos. 
15 Participaciones en empresas/intermediarios financieros, valores negociables/recursos ajenos y cartera de 
valores/intermediarios financieros. 
Gómez Suárez. Mónica 
 
FIGURA 2 
Gráfico de aglomeración 
 
COEFICIENTE
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
Nº GRUPOS
COEFICIENTE
 
 
CUADRO 5 
Indice determinantes del número de grupos 
 
 2 GRUPOS 3 GRUPOS 4 GRUPOS 5 GRUPOS 
INTRA 1.426 0.856 0.643 0.529 
MEDIA 0.825 0.640 0.548 0.586 
ENTRE 0.387 0.547 0.721 0.145 
Nº GRUPOS 2 3 4 5 
F-G 0.409 0.846 0.739 
 
 El índice utilizado ha sido el de Frey y Van Groenewound, ya que el coeficiente cúbico de 
aglomeración (citado por Ketchen y Hook de forma específica en su artículo) sólo se puede calcular a 
través del programa SAS. El numerador del índice se calcula como la diferencia entre la media de las 
distancias intra cluster para los dos niveles de la jerarquía y el denominador como la diferencia entre 
la media de las distancias inter cluster para los dos niveles. El ratio debe ser inferior a 1, eligiéndose 
aquella agrupación que proporcione un índice superior (Milligan y Cooper, 1985). 
 
 Una vez determinado el número de grupos mediante el método de Ward a las variables originales, 
hemos comparado los resultados obtenidos con los procedentes de realizar una agrupación por el 
método k-means (no jerárquico), puesto que la solución que éste manifieste es más estable que la que 
ofrece el método de Ward. La agrupación es la misma cuando se utilizan los centros obtenidos a partir 
de este último método que cuando se tienen centros desconocidos. Por tanto, la clasificación final de 
las entidades es la siguiente: 
 
CUADRO 6 
Composición de los grupos por entidades 
 
GRUPO 1 
(Banca minorista) 
GRUPO 2 
(Banca Universal) 
GRUPO 3 
(Banca minorista- 
empresas) 
GRUPO 4 
(Banca mayorista) 
Popular 
Herrero 
Asturias 
Caja Madrid 
Ibercaja 
Bancaja 
Unicaja 
Inmaculada 
Sabadell 
Laietana 
BBV 
Central Hispano 
Banesto 
Santander 
Catalana 
Bankinter 
Barclays 
BNP España 
San Paolo 
Credit Lyonnais 
 
Guipuzcoano 
Urquijo 
Mapfre 
Banpyme 
Europa 
Caixa 
Cataluña 
Barclays 
Tokyo 
Sumitomo 
América 
Exterior 
Midland 
Napoli 
 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
 Por último, para probar la validez de la agrupación, ya que la fiabilidad ha sido constatada con la 
obtención de los mismos grupos al emplear distintos métodos en la solución de cuatro grupos16, 
hemos aplicado otras tres técnicas de análisis: discriminante, anova y manova. La primera muestra 
que la matriz clasifica correctamente el 97% de los casos, ya que únicamente falla en un caso del 
cuarto grupo. El manova y el análisis de la varianza muestran que la solución es significativa en su 
conjunto y para cada variable por separado. En cuanto al MANOVA el valor del lambda de Wilks es 
de 19,93 con un nivel de significación del 1%. Respecto al ANOVA y el Discriminante sus resultados 
se pueden observar en el cuadro 7. 
 
CUADRO 7 
Validez de la agrupación mediante anova y discriminante 
 
VARIABLES (ANOVA) F 
Tesorería/Inversiones Financieras 38.19** 
Participaciones en Empresas/Intermediarios Financieros de 
Activo 
7.84** 
Cartera de Valores/Intermediarios Financieros de Activo 4.36* 
Depósitos/Recursos Ajenos 171.25** 
Otras Cuentas/Recursos Ajenos 6.05** 
Valores Negociables/Recursos Ajenos 5.43* 
Intermediarios Financieros de Pasivo/Pasivo Total 85.79** 
GRUPOS (DISCRIMINANTE) % Exito en 
clasificación 
Grupo 1 100% 
Grupo 2 100% 
Grupo 3 100% 
Grupo 4 87.5% 
PORCENTAJE GRPOS CLASIFICADOS CORRECTAMENTE 97.06% 
** Significativo al 1% 
* Significativo al 5% 
 
 
 
5. CONCLUSIONES 
 
 El análisis cluster es un método estadístico de clasificación que no necesita acudir a supuestos 
previos sobre la pertenencia a un grupo por parte de la población. Es un método empírico puro, por lo 
que puede ayudar al desarrollo de la ciencia del marketing cuando el objetivo primario de la 
investigación es clasificar consumidores, productos u organizaciones. 
 
 No obstante, esta técnica debe aplicarse con prudencia para que su validez sea plena. En concreto, 
su utilización tiene que ceñirse a unas normas que se basan, sobre todo, en el uso conjunto de varios 
métodos alternativos y de apoyo. 
 
 En este artículo hemos puesto de manifiesto que muchas de las investigaciones realizadas en 
España hasta el momento no han cumplido parte de los requisitos inherentes a la aplicación del 
cluster. Muchas de ellas no mencionan los algoritmos de agrupación o cómo se determina el número 
de grupos. Asimismo, no se prueba, en la mayoría de los casos, la fiabilidad y la validez de las 
soluciones. Esta falta de especificación o de prueba impide la repetición de los resultados en 
investigaciones posteriores y ofrece poca ayuda respecto al procedimiento a utilizar por otros 
investigadores (Punj y Stewart, 1983). Asimismo, hemos demostrado mediante una aplicación 
práctica, cómo se debe utilizar esta técnica. 
 
 
16 La muestra es muy pequeña como para que se pueda cortar en dos grupos. 
Gómez Suárez. Mónica 
 
 El trabajo aquí presentado pretende facilitar la tarea de los investigadores que se plantean utilizar 
el cluster por primera vez o ayudar a perfeccionar su uso en el caso de que se haya aplicado con 
anterioridad, puesto que pese a sus inconvenientes es la única técnica que nos permite clasificar a 
priori una serie de objetos o sujetos, siendo la clasificación el primer y último paso de la investigación 
científica. 
 
BILIOGRAFIA 
 
AGUDO, A. y FERNANDEZ, J.M. (1994), “Métodos de segmentación basados en la aplicación 
combinada de técnicas estadísticas”, VI Encuentro de Profesores Universitarios de Marketing, San 
Sebastian, pp.99-107. 
 
BARNEY, J.B. y HOSKINSON, R.E. (1990). “Strategic groups: untested assertions and researchproposals”, Managerial Decision Economics, Vol.11, pp.187-198. 
 
BEERLI, A. y GARCIA, J.M. (1992). “La segmentación del mercado y su aplicación al mercado 
bancario minorista”, Información Comercial Española, nº707, pp.143-151. 
 
BEERLI, A. y RODRIGUEZ, A. (1994). “El comportamiento del mercado de productos de confección 
textil: hacia una tipología de sus consumidores”, VI Encuentro de Profesores Universitarios de 
Marketing, San Sebastian, pp.382-394. 
 
BIGNE, E. (1990). “El análisis cluster: una aplicación a las áreas de interés en de las agencias de 
publicidad”, Esic-Market, nº69, pp.7-28. 
 
BIGNE, E., VALLET, T., MOLINER, M. y SANCHEZ, J. (1996), “La satisfacción de usuarios de 
servicios públicos hospitalarios”, VIII Encuentro de Profesores Universitarios de Marketing, 
Zaragoza, pp.231-240. 
 
BISQUERRA, R. (1989). Introducción conceptual al análisis multivariable: un enfoque infromático 
con los paquetes SPSS-X, BMDP, LISREL y SPAD, Vol. II, Barcelona, Promociones y Publicaciones 
Universitarias. 
 
CALOMARDE, J.V. (1991). “El análisis cluster aplicado a la segmentación del comportamiento de 
compra por variables ecológicas”. III Encuentro de Profesores Universitarios de Marketing. 
Salamanca, pp.317-345. 
 
CALORMARDE, J.V. (1992). “Actitudes ante el medio ambiente y centros de interés social”, IV 
Encuentro de Profesores Universitarios de Marketing, El Escorial. 
 
CALORMARDE, J.V. (1995). “Actitudes ante el medio ambiente y centros de interés social”, Esic-
Market, nº89, pp.125-154. 
 
CALOMARDE, J.V., GARCIA, B. y MARTINEZ, E. (1997). “La influencia de los factores 
ecológicos en las decisiones de marketing empresarial: el sector del papel y del cartón”, IX Encuentro 
de Profesores Universitarios de Marketing, Murcia, pp.43-64. 
 
CAMARERO, C. y MARTIN, N. (1995). “La comunicación ecológica de las empresas: un estudio 
empírico”, VII Encuentro de Profesores Universitarios de Marketing, Barcelona, pp. 99-109. 
 
CAMARERO, C., GUTIERREZ, I. y RODRIGUEZ, I. (1996). “Insatisfacción, comportamiento de 
queja e intención de recompra: un estudio exploratorio (el caso de la educación universitaria)”, VIII 
Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.43-54. 
 
CESPEDES, J.J. (1996). “Grupos estratégicos en la banca privada española”, Información Comercial 
Española, nº753, pp.106-124. 
 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
CESPEDES, J.J. y SANCHEZ, M. (1996). “Tendencias y desarrollos recientes en métodos de 
investigación y análisis de datos en dirección de empresas”, Revista Europea de Dirección y 
Economía de la Empresa, Vol.5, nº3, pp.23-40. 
 
DILLON, W.R., MULANI, N. y FREDERICK, D.G. (1989). “On the use of componenet scores in the 
presence of group structure”, Journal of Consumer Research, Vol.16, pp.106-112. 
 
DIAZ, A. RIO, B., SANTOS, L. y SANZO, M.J. (1996). “Los valores sociales del consumidor: un 
estudio para el mercado del automóvil”, VIII Encuentro de Profesores Universitarios de Marketing, 
Zaragoza, pp.30-41. 
 
ESPITIA, M., POLO, Y. y SALAS, V. (1991). “Grupos estratégicos y resultados en el sector bancario 
español”, Información Comercial Española, nº690, pp.189-212. 
 
ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1994). “Análisis del comportamiento de la demanda 
turística española procedente de Europa”, VI Encuentro de Profesores Universitarios de Marketing, 
San Sebastian, pp. 470-478. 
 
ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1994). “Análisis del comportamiento de la demanda 
turística española procedente de Europa”, Esic-Market, nº85, pp.183-197. 
 
ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1995). “Análisis comparativo del comportamiento: la 
demanda turística del primer trimestre de 1994-1995”, VII Encuentro de Profesores Universitarios de 
Marketing, Barcelona, pp. 503-512. 
 
FLAVIAN, C. y POLO, Y. (1997). “Los grupos estratégicos como herramienta de análisis de la 
competencia en el sector detallista español”, Esic-Market, nº96, pp.9-28. 
 
FLAVIAN, C. y POLO, Y. (1997). “Identificación de patrones de comportamiento estratégico en la 
gran distribución española”, Información Comercial Española, nº763, pp.99-117. 
 
FONT, B. (1996). “Los procedimientos de análisis cluster aplicados a la distribución comercial”, 
Esic-Market, nº94, pp.73-83. 
 
FRASQUET, M. y MOLLA, A. (1997). “Variedad en el comportamiento de la clientela en centros 
comerciales”, Información Comercial Española, nº763, pp.138-150. 
 
FUENTES, F., BARRIO, S. y SANCHEZ, J. (1997). “Importancia de los atributos calidad/precio en 
el proceso de decisión del consumidor granadino”, IX Encuentro de Profesores Universitarios de 
Marketing, Murcia, pp.171-183. 
 
FUNKHOUSER, G.R. (1983). “A note on the reability of certain clustering algorithms”, Journal OF 
Marketing Research, Vol.20, pp.99-102. 
 
GARCIA, J.M. y RODRIGUEZ, M. (1996). “Grupos estratégicos en el sector del comercio textil: una 
metodología fundamental en las variables del retailing-mix”, Información Comercial Española, nº750, 
pp.133-152. 
 
GOMEZ, M. (1997). “Estrategias de distribución en banca de empresas”, IX Encuentros de 
Profesores Universitarios de Marketing, Murcia, pp.185-201. 
 
GOMEZ, M. y MENDEZ, J.L. (1993). “Imagen y posicionamiento de entidades financieras en la 
CAM”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.269-279. 
 
Gómez Suárez. Mónica 
 
GRANDE, I. y ABASCAL, E. (1993). “Criterios de elección de establecimiento comercial: el caso de 
la tercera edad”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.171-180. 
 
GREEN, P.E., FRANK, R.E. y ROBINSON, P.J. (1967). “Cluster analysis in test market selection”, 
Management Science, Vol.13, pp.387-400. 
 
GUAL, J. y VIVES, X. (1990). Concentración empresarial y competitividad: España en la CEE, 
Barcelona, Ariel. 
 
GUAL, J. y VIVES, X. (1991). Ensayos sobre el sector bancario español, Madrid, FEDEA. 
 
HAIR, J.H., ANDERSON, R.E., TATHAM, R.L. Y BLACK,W.C. (1995). Multivariate data analysis 
with readings, New Jersey, Prentice Hall, 4ª Edición. 
 
HERNANDEZ, M., MUNUERA, J.L. y RUIZ DE MAYA, S. (1995). “La estrategia de diferenciación 
en el comercio minorista”, Información Comercial Española, nº739, pp.27-45. 
 
IGLESIAS, V. (1995). “Tipos de variables y emtodología a emplear en la identificación de grupos 
estratégicos: una aplicación empírica al sector detallista”, Revista Europea de Dirección y Economía 
de la Empresa, Vol.3, nº3, pp.73-86. 
 
IGLESIAS, V. y RUIZ, A. “El análisis de las estrategias de marketing en el comercio minorista”, 
Información Comercial Española, nº763. 
 
JIMENEZ, A. y VARGAS, M. (1995). “El efecto de la satisfacción en la lealtad de la marca”, VII 
Encuentro de Profesores Universitarios de Marketing, Barcelona, pp.271-281. 
 
KLASTORIN, T.D. (1983). “Assesing cluster analysis resaults”Journal of Marketing Research, 
Vol.XX, pp.92-98. 
 
KETCHEN, D.J. y SHOOK, C.L. (1996). “The application of cluster analysis in strategic 
management research: an analysis and critique”, Strategic Management Journal, Vol.17, pp.441-458. 
 
KINNEAR, T.C. y TAYLOR, (1996). Marketing research: an applied approach, 5ª Ed., New York, 
McGraw-Hill. 
 
LUQUE, T. y CORDON, E. (1994). “Una aplicación del análisis multivariable a las características 
socio-económicas y comerciales de las capitales de provincia españolas”, Revista Europea de 
Dirección y Economía de la Empresa, Vol.3, nº1, pp.101-112. 
 
LUQUE, T., FRIAS, D. y MARAVER, G. (1994). “Las escuelas de marketing y los encuentros de 
profesores universitarios”. VI Encuentro de Profesores Universitarios de Marketing, San Sebastian, 
pp.13-25. 
 
LUQUE, T., SANCHEZ, G. y FRIAS, D. (1995). “La innovación en el mercado farmaceútico 
español”, Revista Europea de Dirección y Economía de la Empresa, Vol.4, nº1, pp.47-58. 
 
MARTINEZ VILCHES, R. (1992). Grupos estratégicos en el sector de Cajas de Ahorros Españolas, 
Caja de Ahorros y Monte de Piedad de Madrid. 
 
MAS RUIZ, F.(1991). “Análisis de la competencia en Cajas de Ahorros:grupos estratégicos”. III 
Encuentro de Profesores Universitarios de Marketing. Salamanca, pp.260-263. 
 
MAS RUIZ, F. (1996). Competencia y dinámica de grupos estratégicos: aplicación al sector 
bancario español. Universidad de Alicante. 
 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
MAS RUIZ, F. y GOMEZ SALA, J. (1992). “Identificación de los grupos estratégicos en las Cajas de 
Ahorros españolas”, Revista Europea de Dirección y Economía de la Empresa, Vol.1, nº3, pp.9-28. 
 
MAS RUIZ, F. y GOMEZ SALA, J. (1993). “Análisis de la competencia en cajas de ahorros: grupos 
estratégicos”. Esic-Market, nº79, pp.143-167. 
 
MENDEZ, J.L. (1992). “La actitud de los consumidores frente a las formas comerciales: resultados de 
una investigación sobre hábitos de compra”, Distribución y Consumo, nº4, pp.47-53. 
 
MEYER, A.D. (1991). “What is strategy’s distinctive competence?”, Academy of Management 
Journal, Vol.36, pp.1175-1195. 
 
MILLIGAN, G.W. y COOPER, M.C. (1985). “An examination of procedures for determining the 
number of clusters in a data set”, Psychometrika, Vol.50, nº2, pp.59-179. 
 
MIQUEL, S. y BIGNE, E. (1992). “Un análisis cluster del sector hotelero español”, IV Encuentro de 
Profesores Universitarios de Marketing, El Escorial. 
 
MIQUEL, S., BIGNE, E., LEVY, J.P., CUENCA, A. y MIQUEL, M.J. (1997). Investigación de 
mercados, Madrid, McGraw-Hill. 
 
MOLINER, M.A., VALLET, T. Y SANCHEZ, J. (1994). “Percepción y posicionamiento de los 
servicios públicos. Una aplicación a la ciudad de Castellón”, VI Encuentro de Profesores 
Universitarios de Marketing, San Sebastian, pp.153-163. 
 
MORRISON, D.G. (1967). “Measurement problems in cluster analysis”, Management Science, 
Vol.13, pp.775-780. 
 
MUNUERA, J.L., RUIZ DE MAYA, S., FERNANDEZ, M. y MAS RUIZ, F. (1993). Información 
Comercial Española, nº718, pp.119-138. 
 
MUÑIZ, N. (1996). “Evolución de los grupos estratégicos en la distribución comercial europea”, VIII 
Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.326-338. 
 
MUÑOZ, P. (1993). “Estrategias de posicionamiento en las empresas de distribución comercial”, 
Distribución y Consumo, nº10, pp.46-57. 
 
NARROS, M.J. (1993). “Métodos de segmentación de mercado: un estudio comparativo aplicado a 
las audiencia de radio”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.539-552. 
 
NARROS, M.J. (1994). “Métodos de segmentación de mercado: un estudio comparativo aplicado a 
las audiencia de radio”, Esic-Market, nº87, pp.53-67. 
 
ONIS, T. y RIALP, J. (1996). “La elección de una universidad: el caso concreto de la UAB”, VIII 
Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.93-102. 
 
PENELAS, A. (1992).”Generación de estrategias naturales en el marketing bancario”, IV Encuentro 
de Profesores Universitarios de Marketing, El Escorial. 
 
PUNJ, G. y STEWART, D.W. (1983). “Cluster analysis in Marketing Research. Review and 
suggestions for application”, Journal of Marketing Research, Vol.20, pp.134-148. 
 
RODRIGUEZ, I. TRESPALACIOS, J. Y VAZQUEZ, R. (1994). “La actitud como determinante del 
grado de satisfacción de un servicio”, VI Encuentro de Profesores Universitarios de Marketing, San 
Sebastian, pp. 413-423. 
Gómez Suárez. Mónica 
 
 
RODRIGUEZ, I. TRESPALACIOS, J. Y VAZQUEZ, R. (1994). “La actitud como determinante del 
grado de satisfacción de un servicio”, Esic-Market, nº85, pp.157-170. 
 
RUIZ, A. (1993). “Segmentación del mercado financiero de economías familiares: un estudio 
empírico”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.291-306. 
 
RUIZ, A. (1997). “Segmentación del mercado financiero de economías familiares: un estudio 
empírico”, Esic-Market, nº97, pp.9-41. 
 
RUIZ, A., GONZALEZ, F. e IGLESIAS, V. (1996). “Comercialización de un producto 
indiferenciado: la gasolina en España”, VIII Encuentro de Profesores Universitarios de Marketing, 
Zaragoza, pp.311-325. 
 
SANTESMASES, M. (1997). Dyane: diseño y análisis de encuestas en investigación social y de 
mercados. Madrid, Pirámide. 
 
SCHUMAN, A. (1967), “Letter to the editor”. Management Science, Vol.13, pp.688-696. 
 
THOMAS, H. y VENKATRAMAN, N. (1988). “Research on strategic groups: progress and 
prognosis”, Journal of Management Studies, Vol.25, pp.537-555. 
 
TRESPALACIOS, J., RIO, A. e IGLESIAS, V. (1997). “Dimensiones de la orientación al mercado y 
sus efectos sobre las empresas del sector agroalimentario”, IX Encuentros de Profesores 
Universitarios de Marketing, Murcia, pp.428-443. 
 
VAZQUEZ, R., RODRIGUEZ, I. y RUIZ, A. (1995). “Calidad de servicio y su percepción por el 
consumidor: aplicación a las empresas detallistas”, VII Encuentro de Profesores Universitarios de 
Marketing, Barcelona, pp.415-431. 
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING... 
 
 
ANEXO 
 
DEFINICIONES 
METODOS DE AGRUPACION 
 
Todos los métodos se basan o bien en la matriz de distancias o bien en la de similitudes mediante pares de 
casos. Los métodos difieren en la manera en que estiman las semejanzas o diferencias entre los clusters en 
los pasos sucesivos. Debido a que la unión de cada paso depende de la medida de distancia o similitud, se 
pueden dar distintas soluciones para el mismo método. Uno de los métodos menos complejos es el 
encadenamiento simple, llamado también vecino más cercano. Primero se combinan los dos casos con 
menos distancia o más similitud entre ellos. La distancia entre el nuevo cluster y los casos individuales se 
calcula como la mínima distancia entre el caso individual y un caso del cluster. En cada paso, la distancia 
entre dos cluster es la que existe entre sus dos puntos más cercanos. El encadenamiento completo o 
técnica del vecino más lejano se basa en lo contrario, de tal forma que la distancia entre dos clusters se 
calcula como la existente entre sus puntos más lejanos. El UPGMA o encadenamiento medio entre grupos 
define la distancia entre dos clusters como la media de las distancias entre todos los pares de casos en que 
cada miembro del par proviene de un cluster diferente. Sólo considera, pues, las distancias entre pares de 
casos de diferentes clusters. Al tener en cuenta la información de todas las distancias entre pares de 
individuos, no solamente de los más alejados o de los más próximos, suele ser uno de los métodos más 
utilizados. Una variante de este método es el encadenamiento medio intra grupos, en el cual se combinan 
los grupos de tal forma que la distancia promedio entre todos los casos del cluster resultante sea los más 
pequeña posible. Uno de los métodos más usados es el de Ward. Calcula la media de todas las variables 
de cada cluster. Luego calcula la distancia euclídea al cuadrado entre cada individuo y la media de su grupo. 
Se suman después las distancias de todos los casos y en cada paso, los clusters que se forman son 
aquellos que resultan con el menor incremento en la suma total de las distancias intra-cluster. El método del 
centroide calcula la distancia entre dos clusters como la distancia entre sus medias para todas las variables. 
Una desventaja de este método es que la distancia en que los clusters se combinan puede decrecer de un 
paso a otro, de ahí que los clusters que se unen en las últimas etapas sean menos parecidos a los que se 
unen en las primeras, propiedad poco deseable. 
 
 
MEDIDAS DE DISTANCIA Y SIMILITUD 
 
La proximidad se mide a través de la distancia o de la similitud. Ambas miden la proximidad entre dos 
objetos o dos sujetos, pero la distancia se utiliza para variables cuantitativas y la similitud mide la cercanía 
entre dos sujetos u objetos en función de unas variables cualitativas. En el cluster los objetos se agrupan 
según su cercanía, es decir por su mayor similitud o su menor distancia.Hay diferentes medidas de distancia 
y similitud. La selección de la medida de distancia debería basarse tanto en sus propiedades como medida 
como en el algoritmo de formación del cluster. Se debe saber que distintas medidas de proximidad puedendar resultados distintos para los mismos datos. Una de las medidas mas usadas es la euclidiana al 
cuadrado, que se define como la raiz de la suma de las diferencias al cuadrado de todas las variables.Las 
medidas de similitud se realizan sobre escalas nominales y se calculan comparando las filas de datos para 
el i-ésimo y j-ésimo individuo en base a una tabla de asociación. Las medidas de distancia sirven para medir 
la proximidad entre variables numéricas. La más utilizada es la distancia euclidea, aunque también se 
pueden utilizar la distancia absoluta, la D de Mahalanovis -que se basa en la matriz de covarianzas, entre 
otras. 
 
 
Gómez Suárez. Mónica 
 
 
 Dendrogram using Ward Method
 Rescaled Dista nce Cluster Combine
 C A S E 0 5 10 15 20 25
 Label Num +---------+---------+- --------+---------+---------+
 IBERCAJA 15 
 BANCAJA 30 
 HERRERO 13 
 LAIETANA 28 
 UNICAJA 27 
 CA SABADELL 29 
 POPULAR 12 
 INMACULADA 16 
 CAJAMADRID 14 
 ASTURIAS 26 
 MAPFRE 32 
 BANPYME 33 
 URQUIJO 17 
 BARCLAYS, S.A.E. 31 
 CAIXA 19 
 CA CATALUÐA 20 
 GUIPUZCOANO 18 
 EUROPA 34 
 BBV 1 
 BCH 2 
 SANTANDER 3 
 BNP ESPAÐA 21 
 BANESTO 5 
 CATALANA 6 
 SAN PAOLO DI TORINO 23 
 ZARAGOZANO 7 
 CREDIT LYONNAIS 22 
 BANKINTER 4 
 BEX 8 
 AMERICA 9 
 SUMITOMO 10 
 TOKYO 24 
 MIDLAND 11 
 NAPOLI 25 
Dendrogram using Complete Linkage
 Rescaled Dista nce Cluster Combine
 C A S E 0 5 10 15 20 25
 Label Num +---------+---------+- --------+---------+---------+
 IBERCAJA 15 
 BANCAJA 30 
 HERRERO 13 
 LAIETANA 28 
 UNICAJA 27 
 CA SABADELL 29 
 POPULAR 12 
 INMACULADA 16 
 CAJAMADRID 14 
 ASTURIAS 26 
 BANESTO 5 
 CATALANA 6 
 SAN PAOLO DI TORINO 23 
 CREDIT LYONNAIS 22 
 ZARAGOZANO 7 
 BBV 1 
 BCH 2 
 BNP ESPAÐA 21 
 SANTANDER 3 
 BANKINTER 4 
 MAPFRE 32 
 BANPYME 33 
 URQUIJO 17 
 BARCLAYS, S.A.E. 31 
 CAIXA 19 
 CA CATALUÐA 20 
 GUIPUZCOANO 18 
 EUROPA 34 
 BEX 8 
 AMERICA 9 
 SUMITOMO 10 
 TOKYO 24 
 MIDLAND 11 
 NAPOLI 25 
 Dendrogram using Ward Method
 Rescaled Dista nce Cluster Combine
 C A S E 0 5 10 15 20 25
 Label Num +---------+---------+- --------+---------+---------+
 IBERCAJA 20 
 BANCAJA 26 
 UNICAJA 23 
 CA SABADELL 25 
 HERRERO 18 
 GUIPUZCOANO 28 
 LAIETANA 24 
 CAIXA 29 
 CA CATALUÐA 30 
 POPULAR 17 
 INMACULADA 21 
 CAJAMADRID 19 
 ASTURIAS 22 
 EUROPA 34 
 MAPFRE 32 
 BANPYME 33 
 BBV 1 
 BCH 2 
 BNP ESPAÐA 8 
 CREDIT LYONNAIS 9 
 SANTANDER 3 
 BANESTO 5 
 CATALANA 6 
 SAN PAOLO DI TORINO 10 
 ZARAGOZANO 7 
 URQUIJO 27 
 BARCLAYS, S.A.E. 31 
 BANKINTER 4 
 BEX 11 
 AMERICA 12 
 MIDLAND 14 
 SUMITOMO 13 
 TOKYO 15 
 NAPOLI 16 
 Dendrogram using Complete Linkage
 Rescaled Dista nce Cluster Combine
 C A S E 0 5 10 15 20 25
 Label Num +---------+---------+- --------+---------+---------+
 IBERCAJA 20 
 BANCAJA 26 
 UNICAJA 23 
 CA SABADELL 25 
 HERRERO 18 
 GUIPUZCOANO 28 
 LAIETANA 24 
 CAIXA 29 
 CA CATALUÐA 30 
 POPULAR 17 
 INMACULADA 21 
 CAJAMADRID 19 
 ASTURIAS 22 
 EUROPA 34 
 MAPFRE 32 
 BANPYME 33 
 URQUIJO 27 
 BARCLAYS, S.A.E. 31 
 BANKINTER 4 
 BNP ESPAÐA 8 
 CREDIT LYONNAIS 9 
 BANESTO 5 
 CATALANA 6 
 SAN PAOLO DI TORINO 10 
 ZARAGOZANO7 
 BBV 1 
 BCH 2 
 SANTANDER 3 
 BEX 11 
 AMERICA 12 
 MIDLAND 14 
 SUMITOMO 13 
 TOKYO 15 
 NAPOLI 16 
 
DENDROGRAMA VARIABLES (WARD) DENDROGRAMA VARIABLES (COMPLETO) 
DENDROGRAMA SIN DEPOSITOS/REC.AJENOS DENDROGRAMA CON FACTORES

Continuar navegando

Otros materiales