preprintCLUSTERGomezESIC2002

Marketing

•

Teodoro Olivares

Maria Sosa

7/11/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Marketing

88.796 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

EL ANALISIS CLUSTER EN
INVESTIGACIÓN DE
MARKETING: METODOLOGIA
Y CRITICA

MONICA GOMEZ SUAREZ
UNIVERSIDAD AUTONOMA DE MADRID1

Resumen:

En este trabajo se realiza un análisis crítico de la literatura sobre la aplicación de la técnica de cluster en
marketing durante los años noventa. Para ello, se exponen en primer lugar una serie de pasos esenciales a
seguir según los expertos cuando se aplica dicha técnica. A continuación se revisa el número de artículos
y tesis doctorales escritos en el extranjero en el período 1987-1997, llevándose a cabo con posterioridad
una análisis exhaustivo sobre la utilización del cluster en marketing dentro de nuestro país (1990-1997).
Por último, se expone una aplicación práctica de la técnica que sigue los pasos anteriormente descritos.

Summary

This article presents an examination of the literature written about the application of the cluster analysis
in marketing in the 90’s. First, we introduce the required steps when applying this technique in the
experts point of view. Afterwards, the number of articles and dissertations publised abroad (1987-1997)
is under review, studying as well the applicarion of cluster in marketing in Spain (1990-1997). Finally,
there is a exposition about the practical use of the technique, which follows the steps described before.

1 Dpto. Financiación e Investigación Comercial. Facultad de CC.Empresariales. UAM. 28049
CANTOBLANCO. MADRID. Tfno: (91)3974348.
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

1. INTRODUCCION

El desarrollo informático ha extendido la aplicación en el área de marketing de distintas técnicas de
análisis de datos con gran complejidad estadística. Entre los procedimientos más empleados se
encuentran el análisis factorial, la regresión múltiple, el análisis discriminante múltiple y el análisis
cluster.

El objetivo principal de esta última técnica multivariante es la búsqueda de grupos u objetos
relativamente homogéneos. Su nombre se utiliza para definir una serie de técnicas que tienen por objeto
la búsqueda de grupos similares de individuos o de variables que se van agrupando en conglomerados. Si
tenemos una muestra de individuos, de cada uno de los cuales se dispone de una serie de observaciones,
el análisis cluster sirve para clasificarlos en grupos lo más homogéneos posible en base a las variables
observadas2.

El origen de esta técnica multivariante se encuentra en la biología y la botánica, debido a que los
investigadores de estas áreas de conocimiento tenían la necesidad de agrupar las distintas especies de
animales y vegetales conocidas, en familias que fueran lo más homogéneas posibles (Miquel, Bigné y
otros, 1997, p.268). La variedad de nombres con los que se denomina a esta técnica se debe precisamente
a su utilización en muy diversas disciplinas, tales como la psicología, la sociología, la economía o la
ingeniería. A pesar de ello, todos los métodos desarrollados tienen una dimensión común: clasificar de
acuerdo con la relación natural que existe entre los sujetos u objetos (Hair, Anderson y otros, 1995). El
análisis cluster se conoce desde hace varias décadas. En los años 30 se desarrollaron algunas tímidas
aplicaciones, aunque comenzó a adquirir verdadero auge fue en los años 50.

Las aplicaciones del análisis cluster al marketing han sido múltiples, aunque, lógicamente, el campo
donde mayores niveles de aplicación alcanza y donde más beneficios ofrece es el de la segmentación de
mercados. También se ha utilizado en la identificación de hábitos de compra, de grupos de productos
competitivos, valoración de productos de competidores o identificación de localidades que serán usadas
posteriormente como mercados de prueba. En los últimos años, se ha revelado como la técnica más
utilizada en el análisis de grupos estratégicos y en el desarrollo de tipologías estratégicas, casi siempre en
combinación con otras técnicas multivariantes, como el análisis factorial y el análisis de la varianza.

Sin embargo, el uso del análisis cluster también ha sido objeto de numerosos ataques, tanto dentro de
la investigación de marketing como de la dirección estratégica (Green, Frank y Robinson, 1967;
Morrison, 1967; Schuman, 1967; Funkhouser, 1983; Ketchen y Shook, 1996; Barney y Hoskisson, 1990;
Meyer, 1991), fundamentalmente por los siguientes aspectos:

i. La excesiva confianza que se deposita en el juicio del investigador al aplicar esta
técnica, ya que, a diferencia de otros métodos, el cluster no ofrece un contraste
estadístico que facilite una respuesta concreta sobre la confirmación o no de los
resultados que sirven de apoyo a las hipótesis planteadas en la investigación.

ii. Muchas aplicaciones del análisis cluster no se han basado en una racionalidad teórica. A
menudo, las dimensiones o variables parecen haberse seleccionado al azar y los grupos
que se identifican no reflejan condiciones reales sino que son simples “artificios
estadísticos supeditados a variaciones númericas aleatorias entre organizaciones”
(Thomas y Venkatraman, 1988). De ahí que con la utilización del cluster se asuma un

2 La palabra "cluster", que define estas técnicas, se podría traducir como grupo, conglomerado, racimo, apiñarse. En
general, en todos los paquetes estadísticos se conserva su nombre inglés, aunque también se conoce como análisis de
conglomerados, taxonomía numérica, análisis tipológico o clasificación automática. El cluster se puede utilizar de
dos formas muy distintas: clasificación o representación de estructuras de datos. El primer objetivo -clasificación- es
la más común de las aplicaciones (Punj y Stewart, 1983). Por esta razón, el artículo se centra en el cluster como
forma de clasificación.
Gómez Suárez. Mónica

notable grado de riesgo de ofrecer clasificaciones inexactas, sino imponiendo grupos
que realmente no existen.

iii. La escasa fiabilidad que algunos autores atribuyen a determinados algoritmos de
agrupación (Funkhouser, 1983).

Incluso algunos autores han afirmado que esta técnica es un “estigma metodológico” (Meyer, 1991)
cuestionando su valor como método aplicado a la investigación, debido a los resultados equívocos a los
que lleva a veces su utilización (por ejemplo, en la configuración de grupos estratégicos, donde no se ha
demostrado de forma consistente la relación entre la pertenencia a un grupo y los resultados).

A pesar de esta controversia, el análisis cluster sigue siendo una de las técnicas multivariantes más
utililizadas por los investigadores de marketing en nuestro país. Por esta razón, el propósito de este
artículo es analizar su aplicación actual dentro de esta disciplina en España, haciendo primero un breve
repaso de la situación a nivel internacional. Nuestro objetivo no es sólo evaluar su uso en el pasado, sino
también configurar unas líneas maestras que guíen la investigación mediante su aplicación en el futuro,
para poder hacer posible su mejor utilización.

Para ello, en este trabajo, describimos que aspectos son críticos en la metodología de una
investigación cuando se utiliza el cluster. Posteriormente, analizamos numéricamente la evolución de las
publicaciones basadas en la aplicación de esta técnica a nivel internacional dentro del marketing. A
continuación, realizamos una revisión metodológica en profundidad de los artículos y ponencias
publicados en España en los años 90 en las principales revistas y congresos relacionados con esta
disciplina. Por último, a través de una aplicación práctica y como resultado de la comparación entre las
prácticas existentes y las que proponemos, ofrecemos una serie de recomendaciones que ayuden a los
investigadores de marketing a maximizar el valor del análisis cluster. El objetivo de este artículo no es
analizar, sin embargo, las primeras aplicaciones en el ámbitodel marketing ni hacer un resumen de su
gestación como técnica, sino estudiar la utilización en su época de consolidación.

2. ASPECTOS CONCEPTUALES Y CRITICOS

En este epígrafe exponemos los principales aspectos relacionados con la aplicación del análisis
cluster. No tratamos de ofrecer, sin embargo, una explicación detallada de todos los puntos específicos
que acompañan a la aplicación de esta técnica (algoritmos, medidas de distancia, etc), puesto que éstos
ya aparecen en una serie de publicaciones anteriores3, tanto dentro como fuera del área de marketing. No
resulta muy difícil agrupar estos aspectos, ya que la mayoría de los expertos han destacado varios de
ellos. Sí es una tarea más complicada determinar cuál debe ser la metodología correcta pues, en la
mayoría de los casos, estos mismos expertos no han llegado a un acuerdo.

Como primera medida, hemos determinado una serie de puntos esenciales por los que cualquier
investigador debe optar al aplicar esta técnica. Al no existir un consenso sobre qué elección es la mejor
en algunas ocasiones, el investigador debe analizar las fuerzas o debilidades de un determinado enfoque
y elegir áquel que resulte más conveniente a la hora de aportar objetividad a la investigación que
desarrolla. Estos puntos esenciales al aplicar el análisis cluster son: la selección de variables, los
algoritmos o métodos de agrupación, la determinación del número de grupos y la validación de los
resultados4.

Selección de variables

3 Por ejemplo, Klastorin (1983), Punj y Stewart (1983), Bisquerra (1989), Noururis (1993), Hair y otros (1995),
Kinnear y Taylor (1996), Miquel, Bigné y otros (1997).
4 El esquema que seguimos se basa en el artículo publicado por Ketchen y Shook en el Strategic Management
Journal en 1996. Dicho artículo analizaba todos las investigaciones sobre estrategia publicadas en las seis
revistas prestigiosas de management (Academy of Management Journal, Journal of International Business
Studies, Journal of Management, Management Science y Strategic Management Journal) desde 1977 hasta 1993.
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

La selección de variables que se incluyen en el análisis es una paso crucial, ya que si se excluyen
variables importantes éste será insuficiente y pobre. En el cluster, la selección inicial de variables
determina las características que se usarán para identificar los grupos. Existen fundamentalmente tres
métodos de selección de variables: inductivo, deductivo y cognitivo. El primero, en el que ni las
variables ni el número de grupos que se espera obtener tienen un nexo con una teoría, es el que más se
utiliza en estudios exploratorios. El segundo se apoya en la literatura teórica preexistente. A diferencia
del anterior, la consistencia interna de los grupos es mayor, ya que no se incluyen variables irrelevantes
que disminuyen la validez de las agrupaciones resultantes. El método congnitivo está muy cercano, en la
práctica, al inductivo, ya que no se basa en apreciaciones teóricas (hipótesis), sino que utiliza las
predicciones de determinados expertos de la industria para definir las variables (Ketchen y Shook, 1996).

La selección de variables basada en uno de estos tres métodos depende de los objetivos de la
investigación. Si existe una teoría previa, se debe confirmar mediante la utilización de las variables que
facilita. No obstante, en muchas ocasiones, los estudios realizados en el campo del marketing son
exploratorios y, por tanto, se debe recurrir a un enfoque inductivo o cognitivo. Si tenemos acceso a las
opiniones de expertos, es recomendable considerarlas, ya que de esta forma aumentaremos la
probabilidad de que las variables reflejen fielmente la realidad.

La estandarización de las variables y la utilización de factores que provienen de un análisis factorial
previo son también dos aspectos que se deben tratar en este epígrafe. Al utilizar diferentes unidades de
medida en las distintas variables, áquellas que se midan con grandes números solaparán a las que se
miden con números pequeños. Para resolver este problema se pueden estandarizar las variables aunque
no siempre es la mejor estrategia, ya que el proceso de estandarización permite que las variables
contribuyan de igual forma a la definición de los grupos, pero también puede eliminar diferencias
significativas entre los elementos de análisis (Funkhouser, 1983). Debido a que no hay un consenso entre
los expertos en cuanto a la estandarización o no de las variables, la mejor estrategia es emplear ambos
enfoques (estandarización y no estandarización). Si la solución no es consistente, entonces se debe mirar
la validez de los resultados de cada uno de ellos y elegir áquel cuya solución aporte mayor confianza.

En cuanto a la utilización de factores que provienen de una análisis factorial previo, se pretende
eliminar con ella la multicolinealidad entre variables. También la utilización de factores, en vez de
variables, ha suscitado controversias entre los investigadores, ya que al emplear sólo los factores que
tienen mayor autovalor se puede eliminar información que pueda ser importante a la hora de diferenciar
entre los individuos5. En este caso, ocurre como con la estandarización, se debe determinar el impacto
que tiene la utilización de los factores o de las variables por separado en la consistencia de los grupos
que se obtienen mediante ambos enfoques.

Algoritmos o métodos de agrupación

Existen muchas formas de combinar los objetos. Ninguno de los métodos proporciona una
solución óptima a todos los problemas, ya que es posible llegar a distintos resultados según el método
elegido por el investigador. En general, se suele distinguir entre métodos jerárquicos y no jerárquicos
(también denominados iterativos). Los primeros van agrupando o dividiendo los grupos sin tener que
determinarse a priori el número de grupos final. Estos procedimientos se clasifican, a su vez, en
aglomerativos (se agrupan los casos en grupos hasta que se forma un único grupo) y en divisivos (parte
del grupo total y lo corta en grupos hasta llegar a cada caso concreto). Si se utilizan métodos no
jerárquicos, se debe dar una solución a priori en cuanto al número de grupos que se forman.

El primer paso del método aglomerativo consiste en considerar cada caso como un grupo
distinto. Después se combinan dos de los casos en un sólo grupo, un tercer caso se añade al cluster o se
combina con otro para formar un cluster distinto. Así pues, en cada paso, un caso individual se añade a

5 Por ejemplo, Dillon, Mullani y Frederick (1989) demuestran que al aplicar un análisis de componentes
principales y elegir sólo aquellos factores que explican mayor varianza, se eliminan dos factores que sirven para
determinar las mayores diferencias entre los estilos de vida de distintos grupos de personas pertenecientes a la
tercera edad.
Gómez Suárez. Mónica

los clusters ya existentes o se combina con otro para formar un nuevo cluster. Una vez formado el
cluster, ya no se puede cortar, sólo se puede combinar con otros clusters. En general hay tres tipos de
submétodos dentro del aglomerativo:

1. Métodos de encadenamiento
2. Métodos de varianza
3. Métodos centroides6

Los métodos jerárquicos divisivos se han utilizado menos en las ciencias sociales,
fundamentalmente por la inexistencia de programas que permitieran realizar el análisis de los datos.
Entre los algoritmos más conocidos se puede citar el de Howard-Harris, que forma grupos, por
división de otros de tamaño mayor, de modo también secuencial, utilizando el criterio de
minimización de la varianza intragrupos en cada nivel de la división (Santesmases, 1997).

Las principales desventajas asociadas a la utilización de los métodos jerárquicos son:

- La dificultad de determinar a priori el mejoralgoritmo cuando el investigador desconoce la
estructura de la muestra y

- La inestabilidad de las soluciones que se aprecia cuando el tamaño muestral es reducido y/o hay
presencia de casos atípico (outliers).

En cuanto a los métodos no jerárquicos, el más utilizado es el k-means. Su principal inconveniente
se deriva de que, a menudo, no se sabe cuál es el número de grupos que debe haber. Sin embargo, las
soluciones se ven menos afectadas por la existencia de casos atípicos.

La solución que suelen dar los expertos en cuanto a la elección del método de agrupación es la de
combinar ambos tipos de algoritmos en dos etapas: primero determinar el número de grupos mediante
un método jerárquico y, una vez definida la mejor solución en cuanto a número de grupos, utilizar un
algoritmo no jerárquico7. Asimismo, se debe considerar la medida de distancia o similitud utilizada8.

Determinación del número de grupos

La literatura ofrece diferentes criterios que pueden ayudar al investigador a tomar la decisión
relativa al número óptimo de grupos a formar. Cuando se aplica un método jerárquico, el criterio más
frecuentemente utilizado es la observación del dendrograma (representación gráfica del proceso de
agrupación). También se acude a la observación del coeficiente de aglomeración (valor numérico en
el que se une varios casos que forman un nuevo grupo), bien mediante gráficos (coeficiente en un eje
y número de casos en otro), bien mediante la utilización de medidas matemáticas que expresan los
cambios incrementales en el coeficiente9. Otra forma de obtener los grupos se consigue mediante el
ajuste global obtenido con cada grupo y la mejora experimentada en dicho ajuste con un grupo
adicional10. Por último, la existencia de una teoría previa puede facilitar la determinación de los
grupos sin basarse en una medida gráfica o estadística.

Validación de los grupos

6 Ver Anexo 1
7 Si se desea ver una comparación entre los métodos de agrupación jerárquicos y no jerárquicos se puede
consultar a Bigné, Miquel y otros (1997, pág.276).
8 Ver anexo 2
9 Las medidas que se suelen utilizar se basan en la homogeneidad dentro del grupo en relación a la
heterogeneidad entre grupos. Existen hasta treinta índices distintos desarrollados por distintos expertos, siendo
los más eficientes el de Calinski y Harabatz, el Je(2)/Je(1), el índice C y el índice de Beale (Milligan y Cooper,
1985).
10 El criterio de parada es el siguiente (Flavián y Polo, 1997, pág.110):
1.) El porcentaje de la varianza intragrupo explicado con cada agrupación debe superar el 60%.
2.) El incremento del porcentaje en la explicación de la varianza intra con la inclusión de un nuevo
grupo en cada etapa debe ser superior al 5%.
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

En este caso, se trata de determinar tanto la fiabilidad como la validez de las soluciones que se han
alcanzado. En cuanto a la fiabilidad, se debe probar que los resultados son consistentes, utilizando
distintos algoritmos de agrupación y distintos métodos que muestren la inexistencia de
multicolinealidad. Asímismo, se puede demostrar la fiabilidad partiendo la muestra de tal forma que
una mitad sirva para definir los grupos y la otra para probar su consistencia. Sin embargo, muchas
veces es difícil acudir a esta medida porque las muestras son muy pequeñas.

Si se ha demostrado la fiabilidad, aún queda por probar la validez, tanto externa (la solución sobre
la muestra es representativa de la población) como interna (es útil para predecir resultados). En cuanto
a la validez externa, se debe acudir a una muestra parecida de la población que determine los mismos
resultados. Respecto a la interna, se deben utilizar contrastes estadísticos que permitan establecer la
consistencia de la solución. Normalmente se acude al análisis de la varianza o a otra técnica
multivariante como el análisis discriminante11.

A lo largo del epígrafe hemos puesto de manifiesto que la mayoría de estos aspectos dependen del
juicio del investigador, ya que ni los mismos expertos en la técnica se ponen de acuerdo en cuanto a
su utilización. No obstante, siempre se pueden emplear métodos alternativos y comprobar su
consistencia y validez. En el siguiente epígrafe, expondremos la metodología seguida para practicar el
estudio de los procedimientos más extendidos en la aplicación del análisis cluster al maketing, tanto a
nivel internacional, como en España.

3. PROCESO DE REVISION DE LA LITERATURA

3.1. Metodología

La revisión de la literatura acerca de la aplicación del cluster al marketing se ha llevado a cabo en
dos etapas. La primera ha consistido en evaluar de forma numérica los trabajos publicados a nivel
internacional entre 1986-1997, basándonos en el examen de las principales bases de datos de revistas
y tesis extranjeras. En la segunda fase, nos centramos en una revisión profunda de la bibliografía
publicada en España, limitándonos al período 1990-1997, ya que la mayoría de los trabajos han ido
apareciendo desde principios de la década actual.

La revisión bibliográfica a nivel internacional efectuada se apoya en las bases de datos en formato
CD-ROM, en concreto ABI-INFORM, ECONLIT y UMI (tesis doctorales). La principal desventaja de
utilizar como referencia estas bases de datos es que se centran en fuentes anglosajonas,
fundamentalmente estadounidenses, apenas considerando publicaciones europeas.

En cuanto a los trabajos a nivel nacional, al no existir una base de datos completa sobre revistas
españolas, hemos revisado exclusivamente las publicaciones más frecuentes sobre temas de marketing,
concretamente, ESIC Market, Distribución y Consumo, Revista Europea de Dirección y Economía de la
Empresa, Información Comercial Española, Investigación y Marketing y Revista Española de
Investigación de Marketing. Debemos reconocer, por tanto, el sesgo que hemos introducido en esta
investigación al no tener en cuenta otras publicaciones. La otra fuente bibliográfica de obligada
referencia son las actas de los encuentros de Profesores de Marketing. Respecto a las tesis doctorales,
consultamos la base de datos TESEO.

3.2. Análisis de resultados a nivel internacional

Las primeras revisiones que se realizaron en el área de Marketing sobre la utilización del análisis
cluster se basaron en la construcción estadística de los algoritmos de agrupación, llegando a concluir que
algunos de ellos eran bastante limitados (Sherman y Seth, 1977; Frank y Green, 1968). Posteriormente,
las revisiones obviaron la parte más estadística y se centraron en la aplicación de la técnica. Una de las

11 Existen otras técnicas aparte del anova o discriminante como los que sugieren Klastorin (1983) o Punj y
Stewart (1983), aunque estas dos técnicas son las más utilizadas.
Gómez Suárez. Mónica

revisiones metodológicas más consistentes es la de Punj y Stewart (1983), cuyo objetivo consiste en
clarificar el empleo del cluster, facilitando unas recomendaciones específicas al usuario de la técnica.
Concretamente, la revisión abarca la naturaleza de los datos, el algoritmo utilizado y su descripción, así
como los principales programas de ordenador que permiten aplicar el cluster.

El objetivo de nuestro artículo es determinar cómo se está utilizando el cluster en nuestro país, de ahí
que sólo nos centremos en el número de publicaciones internacionales y no en su revisión analítica. Por
ello, en este apartado acudimos a la metodología de palabras clave con el fin de determinar cuantas
publicaciones y cómo ha sido la evolución numérica de aplicación del análisis cluster. Los resultados de
este análisis se presentan en el cuadro 1. Desde mediados de los años ochenta (primeros artículos que
aparecen en las base de datos) hasta la actualidad se han publicado 77 artículos en las principales revistasde marketing, fundamentalmente en el European Journal of Marketing, en el Journal of the Academy of
Marketing Science (con 11 en cada una de las revistas), en el Journal of Advertising Research (10) y en
el Journal of Marketing Research (8). Asimismo, las tesis doctorales que se han valido de la técnica de
cluster superan el centenar (106 tesis).

CUADRO 1
Número de publicaciones que aplican análisis cluste r a nivel internacional

PUBLICACIONES 1986-89 1990-93 1994-97 TOTAL
JOURNAL OF MARKETING 1 2 0 3
EUROPEAN JOURNAL OF MARKETING 3 6 2 11
JOURNAL OF MARKETING RESEARCH 3 2 3 8
MARKETING & RESEARCH TODAY 0 1 2 3
INTERNATIONAL JOURNAL OF ADVERTISING 2 1 2 5
JOURNAL OF ADVERTISING 0 0 0 0
JOURNAL OF ADVERTISING RESEARCH 5 4 1 10
INTERNATIONAL JOURNAL OF RETAIL &
DISTRIBUTION MANAGEMENT
0 2 1 3
JOURNAL OF CONSUMER RESEARCH 1 2 0 3
JOURNAL OF PROFESSIONAL SERVICES
MARKETING
1 2 0 3
JOURNAL OF PUBLIC POLICY & MARKETING 1 2 0 3
JOURNAL OF THE ACADEMY OF MARKETING
SCIENCE
5 6 0 11
JOURNAL OF THE MARKETING RESEARCH SOCIETY 0 0 3 3
MARKETING MANAGEMENT 1 1 1 3
MARKETING SCIENCE 1 2 0 3
SALES & MARKETING MANAGEMENT 1 0 0 1
JOURNAL OF RETAILING 3 2 1 6
TOTAL REVISTAS 28 35 16 79
TOTAL TESIS DOCTORALES 29 54 23 106
TOTAL DE TRABAJOS 57 89 39 185

La conclusión más relevante cuando se analiza el cuadro es que la aplicación de la técnica objeto de
nuestro estudio disfrutó de un período de introducción bastante largo, fundamentalmente debido a la
incorporación paulatina de programas de software que permitían realizar el análisis cluster y al acceso de
investigadores a esos programas estadísticos, siendo su aplicación notable a finales de los ochenta y
principios de los 90. Desde 1994 los investigadores han ido reduciendo su utilización12.

Nos debemos preguntar porqué el empleo de esta técnica ha disminuido de forma tan significativa. En
nuestra opinión, entre las posibles explicaciones al fenómento detectado, destacan:

12 Hemos considerado que debíamos agrupar en períodos de cuatro años, después de llevar a cabo un análisis
previo de cada año de revisión. Desde 1990 a 1997, se ha pasado de 20 a 5 publicaciones.
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

i comprensión de las limitaciones de la técnica, sobre todo, la subjetividad inherente a su
aplicación e interpretación.

ii. sustitución por otras técnicas más completas que se han ido utilizando con más profusión, al ser
incluidas en los programas estadísticos como el CHAID o los modelos de ecuaciones
estructurales.

3.3. Resultados de la revisión bibliográfica en España

La revisión que hemos realizado en España es mucho más profunda, pues con ella tratamos de
demostrar cómo se está aplicando la técnica del cluster a partir de los puntos que hemos considerado
clave, ya descritos en el apartado 2. En concreto, estos aspectos son el método de determinación de
variables, su estandarización y su agrupación en factores, el algoritmo de agrupación, la forma de
determinación del número de grupos, la validación de los resultados, el programa de ordenador utilizado
y el tema de marketing en el que se pueden encuadrar las investigaciones. Los resultados de esta revisión
se pueden observar en el cuadro 2.

Respecto a la selección de variables, el método más utilizado ha sido una combinación entre
inductivo y cognitivo (25 estudios que suponen el 49% del total). También se acude con frecuencia al
método deductivo (35%). Este resultado pone de manifiesto que aunque casi la mitad de los estudios
tienen un carácter exploratorio, la teorías existentes sobre el tema que se está investigando son
abundantes y permiten seleccionar las variables que sirven para configurar los análisis.

Resulta llamativo el dato sobre el bajo número de estudios que estandarizan las variables (9 de 51, lo
que supone un 17% del total). Asimismo, 20 (39%) de los 51 estudios examinados han procedido a
realizar un factorial previo, utilizando las cargas como input de información para el cluster. Tanto la
estandarización como la utilización de las cargas factoriales tienen detractores y defensores entre los
expertos. Sin embargo, es importante que los investigadores comprueben la influencia de la
multicolinealidad, así como el solapamiento de las variables con unidades de medida grandes. Por tanto,
nosotros recomendamos que se prueben las distintas soluciones que se obtienen al aplicar ambas
medidas, puesto que demostrarán la consistencia de la solución. Sobre todo, en cuanto a la correlación
existente entre las variables es conveniente que se indique en los artículos alguna medida que demuestre
si ésta puede influir en la agrupación.

En cuanto a los algoritmos de agrupación se observa que el método más preferido ha sido el no
jerárquico (43%) frente a la combinación de métodos (24%) o los métodos jerárquicos (19%). Debemos
destacar además que un 17% de los estudios no especifican qué procedimiento de agrupación se ha
utilizado.

Creemos que la preferencia por el método no jerárquico (fundamentalmente K-means), se debe a que
en su momento la capacidad de memoria de los ordenadores no facilitaba el uso de un método
alternativo, sobre todo con grandes archivos, de tal forma que los investigadores sólo podían aplicar esta
técnica. De hecho, se puede ver que al avanzar en el tiempo se ha ido sustituyendo la utilización de k-
means por métodos combinados. La combinación preferida ha sido la aplicación conjunta del método de
Ward con k-means, determinando con el primer algoritmo el número de grupos y empleando después los
grupos obtenidos con el método no jerárquico. Respecto al método de Ward se debe advertir que tiende a
sobrevalorar a los casos atípicos (outliers), lo cual suele influir en la solución final. Por ello, y como en
el caso anterior, nuestra recomendación es que se utilicen varios métodos que permitan demostrar la
validez de la solución obtenida.

Gómez Suárez. Mónica

CUADRO 2
Resumen de los aspectos relacionados con la aplicac ión del análisis cluster
Nº Estudios Porcentaje
1. Selección de variables
1.1. Método
Inductivo
Deductivo
Inductivo/Cognitivo
1.2. Análisis factorial previo
1.3. Estandarización de las variables

8
18
25
20
9

15.6
35.2
49.0
39.2
17.6
2. Algoritmos de agrupación
2.1. Jerárquicos
Completo
Ward
Howard-Harris
Entre grupos
Otros
2.2. No jerárquicos
2.3. Combinación
2.4. No especifican

10
4
2
2
1
1
22
10
9

19.6
40.0
20.0
20.0
10.0
10.0
43.1
23.8
17.6
3. Determinación del número de grupos
3.1. Múltiples métodos
3.2. Método simple
3.3. Otros procedimientos
3.4. No especifican

7
11
9
24

13.7
21.6
17.6
47.1

4. Validación de los grupos
4.1. Fiabilidad
4.2. Validez
No especifican
Discriminante
Anova-Manova
Discriminante/Anova

21
11
17
2

17.6

41.2
21.6
33.3
3.9
5. Programa estadístico
5.1. SPSS
5.2. BMDP
5.3. Galaxy
5.4. Dyane
5.5. Systab
5.6. Spad
5.7. No especifican

33
1
3
2
1
3
8

64.7
2.0
5.9
3.9
2.0
5.9
15.7
6. Tipos de análisis
6.1. Grupos estratégicos
6.2. Segmentación
6.3. Otros

11
17
23

21.6
33.3
45.1
6. Tema de marketing
6.1. Comportamiento del consumidor
6.2. Comunicación
6.3. Distribución
6.4. Producto-servicio
6.5. Marketing de servicios
6.6. Otros

9
4
12
2
19
5

18.0
8.0
24.0
4.0
38.0
10.0

1 Elaboración propia basada en la revisión de los artículos publicados en las revistas.
En este sentido, la mejor estrategia consiste en seguir un procedimiento basado en dos etapas (Punj y
Stewart, 1983). En la primera se puede utilizar un método jerárquico que nos ayude a decidir el número
de grupos a identificar, los centroides y los casos atípicos que deben ser eliminados. Los casos restantes
serán objeto de iteraciones partitivasmediante un método no jerárquico aplicado con posterioridad (ver
figura 1).

EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

FIGURA 1
Proceso de elección del número de grupos

METODO
JERARQUICO

SOLUCION PRELIMINAR

1. Nº GRUPOS
2. OBTENCION DE
CENTROIDES
3.ELIMINACION DE
ATIPICOS

METODO NO
JERARQUICO

SOLUCION
FINAL

La determinación del número de grupos es quizá uno de los puntos más débiles de todas las
investigaciones realizadas, puesto que el 47% de los estudios no especifican cómo han llegado a obtener
los grupos. Los que sí lo hacen utilizan un sólo método, normalmente la observación del dendrograma,
con lo que las agrupaciones que se realizan tienen una alta dosis de subjetividad, dependiendo en gran
medida del juicio del investigador. Creemos que la utilización de distintos procedimientos puede ayudar
a determinar cuál es el número de grupos idóneo. Asimismo, estimamos conveniente que en el futuro los
investigadores especifiquen tanto el algoritmo de agrupación como la forma en que han determinado el
número de clusters.

También las indicaciones sobre la validación de la técnica es un aspecto a resaltar en esta revisión,
ya que sólo el 17% de los estudios muestran la fiabilidad, existiendo además 21 investigaciones (41%)
que no se preocupan de demostrar la validez. Quizá resulta difícil probar la fiabilidad a través de cortes
en la muestra, ya que muchas veces estas muestras son pequeñas, pero sí se pueden aplicar distintos
métodos de agrupación que nos ayuden a mostrar la fiabilidad. Respecto a la validez externa ningún
estudio ha tratado de generalizar los datos a la población, por las dificultades que este procedimiento
conlleva. No obstante, creemos que no es tan difícil probar la validez de criterio mediante la aplicación
de contrastes estadísticos u otras técnicas multivariantes que muestren la consistencia de los resultados.
De las 30 investigaciones que prueban dicha validez, la técnica más utilizada es el análisis de la varianza
(33%), seguida del análisis discriminante (21%) o la combinación de ambas (4%).

La utilización o preferencia por determinados algoritmos de agrupación está condicionada por los
programas de ordenador con los que se analiza la información. El programa más usado es el SPSS
Gómez Suárez. Mónica

(64%), seguido muy de lejos por el SPAD y el Galaxy (3 investigaciones cada uno). Ocho
investigaciones no especifican el paquete estadístico. Estos trabajos tampoco mencionan el algoritmo de
agrupación, debiendo el lector confiar en el juicio del autor sobre las decisiones tomadas al aplicar esta
técnica y no pudiendo replicar posteriormente los resultados de la investigación.

Por último, hemos tratado de sintetizar en la tabla 2 los temas prioritarios en las investigaciones
que han empleado el cluster. Como primer dato importante, destacamos que el 33% de los estudios se
ha centrado en segmentación y el 21% en grupos estratégicos, sobre todo, dentro del sector bancario.
Desagregando por temas, el marketing de servicios (38%), la distribución (24%) y el comportamiento
del consumidor (18%) son las áreas de aplicación donde esta técnica se ha desarrollado con más
profusión.

4. APLICACION DEL ANALISIS CLUSTER

En este apartado se procederá a ilustrar la aplicación del análisis cluster siguiendo los pasos que se
han especificado a lo largo del artículo. Para ello, se han utilizado los datos que provienen de los
anuarios de la Asociación Española de Banca y de las Confederación Española de Cajas de Ahorros
en relación a una serie de partidas de Balance que sirven para especificar unos ratios de patrón de
especialización en el sistema bancario respecto a una muestra representativa de bancos y cajas
instalados en España. Este análisis es similar al de grupos estratégicos, aunque en este caso sólo nos
centraremos en una de las dimensiones (actividad en productos-mercado) con el objetivo de
simplificar la aplicación de la técnica. Se ha realizado mediante el paquete estadístico SPSS 6.1.

La selección de las variables se ha basado en un método inductivo-cognitivo, puesto que se han
obtenido a partir de trabajos anteriormente publicados sobre grupos estratégicos en el sistema
bancario español13. Estas variables, que son ratios compuestos de las partidas de balance, se presentan
en el cuadro 3. Todas ellas, sirven para discriminar la actuación de las entidades en el mercado
respecto a su especialización en éste, representando la mayor o menor propensión hacia la actividad
mayorista o minorista.

CUADRO 3
Variables seleccionadas

Tesorería/Inversiones Financieras
Participaciones en Empresas/Intermediarios Financieros de
Activo
Cartera de Valores/Intermediarios Financieros de Activo
Depósitos/Recursos Ajenos
Otras Cuentas/Recursos Ajenos
Valores Negociables/Recursos Ajenos
Intermediarios Financieros de Pasivo/Pasivo Total

Hemos probado los dos métodos jerárquicos a los que más acuden los investigadores (Ward y
Completo) y uno no jerárquico que, combinados con la selección de variables y con la utilización de
factores, proporcionan los siguientes modelos alternativos:

CUADRO 4
Aplicaciones alternativas del análisis cluster
1. Omitiendo una variable significativa
2. Método de Ward con factores
3. Método completo con factores
4. Método de Ward con variables simples
5. Método completo con variables simples
6. Método k-means con variables simples y centros desconocidos
7. Método k-means con variables simples y centros conocidos (procedentes de la aplicación del método

13 Gual y Vives (1991), Espitia, Polo y Salas (1991), Martínez (1996) y Mas (1996).
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

de Ward
En primer lugar, hemos eliminado una de las variables que consideramos más significativas para
diferenciar entre entidades (depósitos/recursos ajenos) con el fin de comprobar cómo cambia la
agrupación respecto a la aplicación que incorpora todas las variables. Los dendrogramas obtenidos
omitiendo una variable muy significativa muestran agrupaciones bastante diferentes a las obtenidas
con todas las variables, tanto mediante el método de Ward como con el completo. Este sencillo
ejercicio demuestra que la omisión de una variable importante pueden conducir a conclusiones
erróneas y, en consecuencia, se recomienda al investigador que preste especial atención a la fase de
selección de variables a incluir en el estudio, ya que los resultados alcanzados son altamente sensibles
a la decisión adoptada (ver anexo).

Al emplear ratios, se eliminan las unidades de medida y por tanto, la estandarización no es
necesaria, ya que produce los mismos resultados respecto a la agrupación que las variables no
tipificadas. Sin embargo, si llevamos a cabo un análisis factorial, se pueden obtener distintas
agrupaciones. Así, al aplicar el análisis de componentes principales con rotación varimax se extraen
dos factores que explican el 67.8% de la varianza del modelo y que agrupan por un lado a las
variables que indican una actividad más o menos tradicional, tanto en activo como en pasivo14, y por
otro a las variables que se relacionan con el mercado de valores y la participación directa en
empresas15. Lógicamente, al perder casi un 30% en la explicación de la varianza, se elimina
información importante a la hora de determinar el comportamiento de las entidades. Para observar la
estabilidad de las soluciones y disponer de criterios válidos para decidir sobre el modelo con o sin
factores, desarrollamos dos cluster mediante dos algoritmos de agrupación distintos empleando los
factores como variables de agrupación (ver anexo). Los dendrogramas obtenidos resultan ser muy
diferentes para cada uno de los métodos siendo la composición de los grupos distinta cuando se utiliza
Ward o completo. Por esta razón, tomamos la decisión de aplicarel análisis a las variables por
separado que, como luego mostraremos, produce soluciones más consistentes.

En efecto, los dendrogramas que se obtienen al aplicar el análisis sobre las variables originales de
forma alternativa con el método completo y el de Ward son muy parecidos. La diferencia entre ambos
está en la composición de las agrupaciones cuando se eligen tres grupos, ya que con cuatro la
composición es la misma con ambos métodos. Con tres grupos, un conglomerado de ocho bancos se
sitúa en una posición distinta cuando se utiliza un método u otro. Sin embargo, si se observan los
dendrogramas (ver anexo), el método completo determina una agrupación menos homogénea entre los
componentes de cada grupo que el de Ward. Por tanto, elegimos este último método para seguir con
nuestra aplicación.

Hemos acudido a tres tipos de medidas para determinar el número de grupos. En primer lugar, la
observación de los dendrogramas. En segundo lugar, la construcción del grafico de aglomeración y
por último, la elaboración de un índices que se basa en la varianza de las agrupaciones. Mediante
todas estas medidas, se puede constatar cuál es la agrupación más adecuada. En efecto, las medidas
gráficas muestran que el conglomerado produce grupos más homogéneos entre sí y más heterogéneos
respecto a los demás grupos. Los dendrogramas se pueden observar en el anexo y el gráfico de
aglomeración en la figura 5. Este gráfico muestra en abscisas el número de grupos y en ordenadas el
coeficiente de aglomeración que se obtiene al unir cada caso a un nuevo grupo. La pendiente de la
curva que se puede formar con todos los puntos cambia de forma muy considerable cuando tenemos
cuatro conglomerados, lo que unido al dendrograma y a la siguiente medida analítica que
comentaremos nos hace concluir sobre el número más adecuado de grupos

14 Inversiones financieras/pasivo, depósitos/recursos ajenos, tesorería/inversiones financieras y otras
cuentas/recursos ajenos.
15 Participaciones en empresas/intermediarios financieros, valores negociables/recursos ajenos y cartera de
valores/intermediarios financieros.
Gómez Suárez. Mónica

FIGURA 2
Gráfico de aglomeración

COEFICIENTE
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
Nº GRUPOS
COEFICIENTE

CUADRO 5
Indice determinantes del número de grupos

2 GRUPOS 3 GRUPOS 4 GRUPOS 5 GRUPOS
INTRA 1.426 0.856 0.643 0.529
MEDIA 0.825 0.640 0.548 0.586
ENTRE 0.387 0.547 0.721 0.145
Nº GRUPOS 2 3 4 5
F-G 0.409 0.846 0.739

El índice utilizado ha sido el de Frey y Van Groenewound, ya que el coeficiente cúbico de
aglomeración (citado por Ketchen y Hook de forma específica en su artículo) sólo se puede calcular a
través del programa SAS. El numerador del índice se calcula como la diferencia entre la media de las
distancias intra cluster para los dos niveles de la jerarquía y el denominador como la diferencia entre
la media de las distancias inter cluster para los dos niveles. El ratio debe ser inferior a 1, eligiéndose
aquella agrupación que proporcione un índice superior (Milligan y Cooper, 1985).

Una vez determinado el número de grupos mediante el método de Ward a las variables originales,
hemos comparado los resultados obtenidos con los procedentes de realizar una agrupación por el
método k-means (no jerárquico), puesto que la solución que éste manifieste es más estable que la que
ofrece el método de Ward. La agrupación es la misma cuando se utilizan los centros obtenidos a partir
de este último método que cuando se tienen centros desconocidos. Por tanto, la clasificación final de
las entidades es la siguiente:

CUADRO 6
Composición de los grupos por entidades

GRUPO 1
(Banca minorista)
GRUPO 2
(Banca Universal)
GRUPO 3
(Banca minorista-
empresas)
GRUPO 4
(Banca mayorista)
Popular
Herrero
Asturias
Caja Madrid
Ibercaja
Bancaja
Unicaja
Inmaculada
Sabadell
Laietana
BBV
Central Hispano
Banesto
Santander
Catalana
Bankinter
Barclays
BNP España
San Paolo
Credit Lyonnais

Guipuzcoano
Urquijo
Mapfre
Banpyme
Europa
Caixa
Cataluña
Barclays
Tokyo
Sumitomo
América
Exterior
Midland
Napoli

EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

Por último, para probar la validez de la agrupación, ya que la fiabilidad ha sido constatada con la
obtención de los mismos grupos al emplear distintos métodos en la solución de cuatro grupos16,
hemos aplicado otras tres técnicas de análisis: discriminante, anova y manova. La primera muestra
que la matriz clasifica correctamente el 97% de los casos, ya que únicamente falla en un caso del
cuarto grupo. El manova y el análisis de la varianza muestran que la solución es significativa en su
conjunto y para cada variable por separado. En cuanto al MANOVA el valor del lambda de Wilks es
de 19,93 con un nivel de significación del 1%. Respecto al ANOVA y el Discriminante sus resultados
se pueden observar en el cuadro 7.

CUADRO 7
Validez de la agrupación mediante anova y discriminante

VARIABLES (ANOVA) F
Tesorería/Inversiones Financieras 38.19**
Participaciones en Empresas/Intermediarios Financieros de
Activo
7.84**
Cartera de Valores/Intermediarios Financieros de Activo 4.36*
Depósitos/Recursos Ajenos 171.25**
Otras Cuentas/Recursos Ajenos 6.05**
Valores Negociables/Recursos Ajenos 5.43*
Intermediarios Financieros de Pasivo/Pasivo Total 85.79**
GRUPOS (DISCRIMINANTE) % Exito en
clasificación
Grupo 1 100%
Grupo 2 100%
Grupo 3 100%
Grupo 4 87.5%
PORCENTAJE GRPOS CLASIFICADOS CORRECTAMENTE 97.06%
** Significativo al 1%
* Significativo al 5%

5. CONCLUSIONES

El análisis cluster es un método estadístico de clasificación que no necesita acudir a supuestos
previos sobre la pertenencia a un grupo por parte de la población. Es un método empírico puro, por lo
que puede ayudar al desarrollo de la ciencia del marketing cuando el objetivo primario de la
investigación es clasificar consumidores, productos u organizaciones.

No obstante, esta técnica debe aplicarse con prudencia para que su validez sea plena. En concreto,
su utilización tiene que ceñirse a unas normas que se basan, sobre todo, en el uso conjunto de varios
métodos alternativos y de apoyo.

En este artículo hemos puesto de manifiesto que muchas de las investigaciones realizadas en
España hasta el momento no han cumplido parte de los requisitos inherentes a la aplicación del
cluster. Muchas de ellas no mencionan los algoritmos de agrupación o cómo se determina el número
de grupos. Asimismo, no se prueba, en la mayoría de los casos, la fiabilidad y la validez de las
soluciones. Esta falta de especificación o de prueba impide la repetición de los resultados en
investigaciones posteriores y ofrece poca ayuda respecto al procedimiento a utilizar por otros
investigadores (Punj y Stewart, 1983). Asimismo, hemos demostrado mediante una aplicación
práctica, cómo se debe utilizar esta técnica.

16 La muestra es muy pequeña como para que se pueda cortar en dos grupos.
Gómez Suárez. Mónica

El trabajo aquí presentado pretende facilitar la tarea de los investigadores que se plantean utilizar
el cluster por primera vez o ayudar a perfeccionar su uso en el caso de que se haya aplicado con
anterioridad, puesto que pese a sus inconvenientes es la única técnica que nos permite clasificar a
priori una serie de objetos o sujetos, siendo la clasificación el primer y último paso de la investigación
científica.

BILIOGRAFIA

AGUDO, A. y FERNANDEZ, J.M. (1994), “Métodos de segmentación basados en la aplicación
combinada de técnicas estadísticas”, VI Encuentro de Profesores Universitarios de Marketing, San
Sebastian, pp.99-107.

BARNEY, J.B. y HOSKINSON, R.E. (1990). “Strategic groups: untested assertions and researchproposals”, Managerial Decision Economics, Vol.11, pp.187-198.

BEERLI, A. y GARCIA, J.M. (1992). “La segmentación del mercado y su aplicación al mercado
bancario minorista”, Información Comercial Española, nº707, pp.143-151.

BEERLI, A. y RODRIGUEZ, A. (1994). “El comportamiento del mercado de productos de confección
textil: hacia una tipología de sus consumidores”, VI Encuentro de Profesores Universitarios de
Marketing, San Sebastian, pp.382-394.

BIGNE, E. (1990). “El análisis cluster: una aplicación a las áreas de interés en de las agencias de
publicidad”, Esic-Market, nº69, pp.7-28.

BIGNE, E., VALLET, T., MOLINER, M. y SANCHEZ, J. (1996), “La satisfacción de usuarios de
servicios públicos hospitalarios”, VIII Encuentro de Profesores Universitarios de Marketing,
Zaragoza, pp.231-240.

BISQUERRA, R. (1989). Introducción conceptual al análisis multivariable: un enfoque infromático
con los paquetes SPSS-X, BMDP, LISREL y SPAD, Vol. II, Barcelona, Promociones y Publicaciones
Universitarias.

CALOMARDE, J.V. (1991). “El análisis cluster aplicado a la segmentación del comportamiento de
compra por variables ecológicas”. III Encuentro de Profesores Universitarios de Marketing.
Salamanca, pp.317-345.

CALORMARDE, J.V. (1992). “Actitudes ante el medio ambiente y centros de interés social”, IV
Encuentro de Profesores Universitarios de Marketing, El Escorial.

CALORMARDE, J.V. (1995). “Actitudes ante el medio ambiente y centros de interés social”, Esic-
Market, nº89, pp.125-154.

CALOMARDE, J.V., GARCIA, B. y MARTINEZ, E. (1997). “La influencia de los factores
ecológicos en las decisiones de marketing empresarial: el sector del papel y del cartón”, IX Encuentro
de Profesores Universitarios de Marketing, Murcia, pp.43-64.

CAMARERO, C. y MARTIN, N. (1995). “La comunicación ecológica de las empresas: un estudio
empírico”, VII Encuentro de Profesores Universitarios de Marketing, Barcelona, pp. 99-109.

CAMARERO, C., GUTIERREZ, I. y RODRIGUEZ, I. (1996). “Insatisfacción, comportamiento de
queja e intención de recompra: un estudio exploratorio (el caso de la educación universitaria)”, VIII
Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.43-54.

CESPEDES, J.J. (1996). “Grupos estratégicos en la banca privada española”, Información Comercial
Española, nº753, pp.106-124.

EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

CESPEDES, J.J. y SANCHEZ, M. (1996). “Tendencias y desarrollos recientes en métodos de
investigación y análisis de datos en dirección de empresas”, Revista Europea de Dirección y
Economía de la Empresa, Vol.5, nº3, pp.23-40.

DILLON, W.R., MULANI, N. y FREDERICK, D.G. (1989). “On the use of componenet scores in the
presence of group structure”, Journal of Consumer Research, Vol.16, pp.106-112.

DIAZ, A. RIO, B., SANTOS, L. y SANZO, M.J. (1996). “Los valores sociales del consumidor: un
estudio para el mercado del automóvil”, VIII Encuentro de Profesores Universitarios de Marketing,
Zaragoza, pp.30-41.

ESPITIA, M., POLO, Y. y SALAS, V. (1991). “Grupos estratégicos y resultados en el sector bancario
español”, Información Comercial Española, nº690, pp.189-212.

ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1994). “Análisis del comportamiento de la demanda
turística española procedente de Europa”, VI Encuentro de Profesores Universitarios de Marketing,
San Sebastian, pp. 470-478.

ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1994). “Análisis del comportamiento de la demanda
turística española procedente de Europa”, Esic-Market, nº85, pp.183-197.

ESTEBAN, A., GARCIA, J. y NARROS, M.J. (1995). “Análisis comparativo del comportamiento: la
demanda turística del primer trimestre de 1994-1995”, VII Encuentro de Profesores Universitarios de
Marketing, Barcelona, pp. 503-512.

FLAVIAN, C. y POLO, Y. (1997). “Los grupos estratégicos como herramienta de análisis de la
competencia en el sector detallista español”, Esic-Market, nº96, pp.9-28.

FLAVIAN, C. y POLO, Y. (1997). “Identificación de patrones de comportamiento estratégico en la
gran distribución española”, Información Comercial Española, nº763, pp.99-117.

FONT, B. (1996). “Los procedimientos de análisis cluster aplicados a la distribución comercial”,
Esic-Market, nº94, pp.73-83.

FRASQUET, M. y MOLLA, A. (1997). “Variedad en el comportamiento de la clientela en centros
comerciales”, Información Comercial Española, nº763, pp.138-150.

FUENTES, F., BARRIO, S. y SANCHEZ, J. (1997). “Importancia de los atributos calidad/precio en
el proceso de decisión del consumidor granadino”, IX Encuentro de Profesores Universitarios de
Marketing, Murcia, pp.171-183.

FUNKHOUSER, G.R. (1983). “A note on the reability of certain clustering algorithms”, Journal OF
Marketing Research, Vol.20, pp.99-102.

GARCIA, J.M. y RODRIGUEZ, M. (1996). “Grupos estratégicos en el sector del comercio textil: una
metodología fundamental en las variables del retailing-mix”, Información Comercial Española, nº750,
pp.133-152.

GOMEZ, M. (1997). “Estrategias de distribución en banca de empresas”, IX Encuentros de
Profesores Universitarios de Marketing, Murcia, pp.185-201.

GOMEZ, M. y MENDEZ, J.L. (1993). “Imagen y posicionamiento de entidades financieras en la
CAM”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.269-279.

Gómez Suárez. Mónica

GRANDE, I. y ABASCAL, E. (1993). “Criterios de elección de establecimiento comercial: el caso de
la tercera edad”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.171-180.

GREEN, P.E., FRANK, R.E. y ROBINSON, P.J. (1967). “Cluster analysis in test market selection”,
Management Science, Vol.13, pp.387-400.

GUAL, J. y VIVES, X. (1990). Concentración empresarial y competitividad: España en la CEE,
Barcelona, Ariel.

GUAL, J. y VIVES, X. (1991). Ensayos sobre el sector bancario español, Madrid, FEDEA.

HAIR, J.H., ANDERSON, R.E., TATHAM, R.L. Y BLACK,W.C. (1995). Multivariate data analysis
with readings, New Jersey, Prentice Hall, 4ª Edición.

HERNANDEZ, M., MUNUERA, J.L. y RUIZ DE MAYA, S. (1995). “La estrategia de diferenciación
en el comercio minorista”, Información Comercial Española, nº739, pp.27-45.

IGLESIAS, V. (1995). “Tipos de variables y emtodología a emplear en la identificación de grupos
estratégicos: una aplicación empírica al sector detallista”, Revista Europea de Dirección y Economía
de la Empresa, Vol.3, nº3, pp.73-86.

IGLESIAS, V. y RUIZ, A. “El análisis de las estrategias de marketing en el comercio minorista”,
Información Comercial Española, nº763.

JIMENEZ, A. y VARGAS, M. (1995). “El efecto de la satisfacción en la lealtad de la marca”, VII
Encuentro de Profesores Universitarios de Marketing, Barcelona, pp.271-281.

KLASTORIN, T.D. (1983). “Assesing cluster analysis resaults”Journal of Marketing Research,
Vol.XX, pp.92-98.

KETCHEN, D.J. y SHOOK, C.L. (1996). “The application of cluster analysis in strategic
management research: an analysis and critique”, Strategic Management Journal, Vol.17, pp.441-458.

KINNEAR, T.C. y TAYLOR, (1996). Marketing research: an applied approach, 5ª Ed., New York,
McGraw-Hill.

LUQUE, T. y CORDON, E. (1994). “Una aplicación del análisis multivariable a las características
socio-económicas y comerciales de las capitales de provincia españolas”, Revista Europea de
Dirección y Economía de la Empresa, Vol.3, nº1, pp.101-112.

LUQUE, T., FRIAS, D. y MARAVER, G. (1994). “Las escuelas de marketing y los encuentros de
profesores universitarios”. VI Encuentro de Profesores Universitarios de Marketing, San Sebastian,
pp.13-25.

LUQUE, T., SANCHEZ, G. y FRIAS, D. (1995). “La innovación en el mercado farmaceútico
español”, Revista Europea de Dirección y Economía de la Empresa, Vol.4, nº1, pp.47-58.

MARTINEZ VILCHES, R. (1992). Grupos estratégicos en el sector de Cajas de Ahorros Españolas,
Caja de Ahorros y Monte de Piedad de Madrid.

MAS RUIZ, F.(1991). “Análisis de la competencia en Cajas de Ahorros:grupos estratégicos”. III
Encuentro de Profesores Universitarios de Marketing. Salamanca, pp.260-263.

MAS RUIZ, F. (1996). Competencia y dinámica de grupos estratégicos: aplicación al sector
bancario español. Universidad de Alicante.

EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

MAS RUIZ, F. y GOMEZ SALA, J. (1992). “Identificación de los grupos estratégicos en las Cajas de
Ahorros españolas”, Revista Europea de Dirección y Economía de la Empresa, Vol.1, nº3, pp.9-28.

MAS RUIZ, F. y GOMEZ SALA, J. (1993). “Análisis de la competencia en cajas de ahorros: grupos
estratégicos”. Esic-Market, nº79, pp.143-167.

MENDEZ, J.L. (1992). “La actitud de los consumidores frente a las formas comerciales: resultados de
una investigación sobre hábitos de compra”, Distribución y Consumo, nº4, pp.47-53.

MEYER, A.D. (1991). “What is strategy’s distinctive competence?”, Academy of Management
Journal, Vol.36, pp.1175-1195.

MILLIGAN, G.W. y COOPER, M.C. (1985). “An examination of procedures for determining the
number of clusters in a data set”, Psychometrika, Vol.50, nº2, pp.59-179.

MIQUEL, S. y BIGNE, E. (1992). “Un análisis cluster del sector hotelero español”, IV Encuentro de
Profesores Universitarios de Marketing, El Escorial.

MIQUEL, S., BIGNE, E., LEVY, J.P., CUENCA, A. y MIQUEL, M.J. (1997). Investigación de
mercados, Madrid, McGraw-Hill.

MOLINER, M.A., VALLET, T. Y SANCHEZ, J. (1994). “Percepción y posicionamiento de los
servicios públicos. Una aplicación a la ciudad de Castellón”, VI Encuentro de Profesores
Universitarios de Marketing, San Sebastian, pp.153-163.

MORRISON, D.G. (1967). “Measurement problems in cluster analysis”, Management Science,
Vol.13, pp.775-780.

MUNUERA, J.L., RUIZ DE MAYA, S., FERNANDEZ, M. y MAS RUIZ, F. (1993). Información
Comercial Española, nº718, pp.119-138.

MUÑIZ, N. (1996). “Evolución de los grupos estratégicos en la distribución comercial europea”, VIII
Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.326-338.

MUÑOZ, P. (1993). “Estrategias de posicionamiento en las empresas de distribución comercial”,
Distribución y Consumo, nº10, pp.46-57.

NARROS, M.J. (1993). “Métodos de segmentación de mercado: un estudio comparativo aplicado a
las audiencia de radio”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.539-552.

NARROS, M.J. (1994). “Métodos de segmentación de mercado: un estudio comparativo aplicado a
las audiencia de radio”, Esic-Market, nº87, pp.53-67.

ONIS, T. y RIALP, J. (1996). “La elección de una universidad: el caso concreto de la UAB”, VIII
Encuentro de Profesores Universitarios de Marketing, Zaragoza, pp.93-102.

PENELAS, A. (1992).”Generación de estrategias naturales en el marketing bancario”, IV Encuentro
de Profesores Universitarios de Marketing, El Escorial.

PUNJ, G. y STEWART, D.W. (1983). “Cluster analysis in Marketing Research. Review and
suggestions for application”, Journal of Marketing Research, Vol.20, pp.134-148.

RODRIGUEZ, I. TRESPALACIOS, J. Y VAZQUEZ, R. (1994). “La actitud como determinante del
grado de satisfacción de un servicio”, VI Encuentro de Profesores Universitarios de Marketing, San
Sebastian, pp. 413-423.
Gómez Suárez. Mónica

RODRIGUEZ, I. TRESPALACIOS, J. Y VAZQUEZ, R. (1994). “La actitud como determinante del
grado de satisfacción de un servicio”, Esic-Market, nº85, pp.157-170.

RUIZ, A. (1993). “Segmentación del mercado financiero de economías familiares: un estudio
empírico”, V Encuentro de Profesores Universitarios de Marketing, Sevilla, pp.291-306.

RUIZ, A. (1997). “Segmentación del mercado financiero de economías familiares: un estudio
empírico”, Esic-Market, nº97, pp.9-41.

RUIZ, A., GONZALEZ, F. e IGLESIAS, V. (1996). “Comercialización de un producto
indiferenciado: la gasolina en España”, VIII Encuentro de Profesores Universitarios de Marketing,
Zaragoza, pp.311-325.

SANTESMASES, M. (1997). Dyane: diseño y análisis de encuestas en investigación social y de
mercados. Madrid, Pirámide.

SCHUMAN, A. (1967), “Letter to the editor”. Management Science, Vol.13, pp.688-696.

THOMAS, H. y VENKATRAMAN, N. (1988). “Research on strategic groups: progress and
prognosis”, Journal of Management Studies, Vol.25, pp.537-555.

TRESPALACIOS, J., RIO, A. e IGLESIAS, V. (1997). “Dimensiones de la orientación al mercado y
sus efectos sobre las empresas del sector agroalimentario”, IX Encuentros de Profesores
Universitarios de Marketing, Murcia, pp.428-443.

VAZQUEZ, R., RODRIGUEZ, I. y RUIZ, A. (1995). “Calidad de servicio y su percepción por el
consumidor: aplicación a las empresas detallistas”, VII Encuentro de Profesores Universitarios de
Marketing, Barcelona, pp.415-431.
EL ANALISIS CLUSTER EN INVESTIGACION DE MARKETING...

ANEXO

DEFINICIONES
METODOS DE AGRUPACION

Todos los métodos se basan o bien en la matriz de distancias o bien en la de similitudes mediante pares de
casos. Los métodos difieren en la manera en que estiman las semejanzas o diferencias entre los clusters en
los pasos sucesivos. Debido a que la unión de cada paso depende de la medida de distancia o similitud, se
pueden dar distintas soluciones para el mismo método. Uno de los métodos menos complejos es el
encadenamiento simple, llamado también vecino más cercano. Primero se combinan los dos casos con
menos distancia o más similitud entre ellos. La distancia entre el nuevo cluster y los casos individuales se
calcula como la mínima distancia entre el caso individual y un caso del cluster. En cada paso, la distancia
entre dos cluster es la que existe entre sus dos puntos más cercanos. El encadenamiento completo o
técnica del vecino más lejano se basa en lo contrario, de tal forma que la distancia entre dos clusters se
calcula como la existente entre sus puntos más lejanos. El UPGMA o encadenamiento medio entre grupos
define la distancia entre dos clusters como la media de las distancias entre todos los pares de casos en que
cada miembro del par proviene de un cluster diferente. Sólo considera, pues, las distancias entre pares de
casos de diferentes clusters. Al tener en cuenta la información de todas las distancias entre pares de
individuos, no solamente de los más alejados o de los más próximos, suele ser uno de los métodos más
utilizados. Una variante de este método es el encadenamiento medio intra grupos, en el cual se combinan
los grupos de tal forma que la distancia promedio entre todos los casos del cluster resultante sea los más
pequeña posible. Uno de los métodos más usados es el de Ward. Calcula la media de todas las variables
de cada cluster. Luego calcula la distancia euclídea al cuadrado entre cada individuo y la media de su grupo.
Se suman después las distancias de todos los casos y en cada paso, los clusters que se forman son
aquellos que resultan con el menor incremento en la suma total de las distancias intra-cluster. El método del
centroide calcula la distancia entre dos clusters como la distancia entre sus medias para todas las variables.
Una desventaja de este método es que la distancia en que los clusters se combinan puede decrecer de un
paso a otro, de ahí que los clusters que se unen en las últimas etapas sean menos parecidos a los que se
unen en las primeras, propiedad poco deseable.

MEDIDAS DE DISTANCIA Y SIMILITUD

La proximidad se mide a través de la distancia o de la similitud. Ambas miden la proximidad entre dos
objetos o dos sujetos, pero la distancia se utiliza para variables cuantitativas y la similitud mide la cercanía
entre dos sujetos u objetos en función de unas variables cualitativas. En el cluster los objetos se agrupan
según su cercanía, es decir por su mayor similitud o su menor distancia.Hay diferentes medidas de distancia
y similitud. La selección de la medida de distancia debería basarse tanto en sus propiedades como medida
como en el algoritmo de formación del cluster. Se debe saber que distintas medidas de proximidad puedendar resultados distintos para los mismos datos. Una de las medidas mas usadas es la euclidiana al
cuadrado, que se define como la raiz de la suma de las diferencias al cuadrado de todas las variables.Las
medidas de similitud se realizan sobre escalas nominales y se calculan comparando las filas de datos para
el i-ésimo y j-ésimo individuo en base a una tabla de asociación. Las medidas de distancia sirven para medir
la proximidad entre variables numéricas. La más utilizada es la distancia euclidea, aunque también se
pueden utilizar la distancia absoluta, la D de Mahalanovis -que se basa en la matriz de covarianzas, entre
otras.

Gómez Suárez. Mónica

Dendrogram using Ward Method
Rescaled Dista nce Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+- --------+---------+---------+
IBERCAJA 15
BANCAJA 30
HERRERO 13
LAIETANA 28
UNICAJA 27
CA SABADELL 29
POPULAR 12
INMACULADA 16
CAJAMADRID 14
ASTURIAS 26
MAPFRE 32
BANPYME 33
URQUIJO 17
BARCLAYS, S.A.E. 31
CAIXA 19
CA CATALUÐA 20
GUIPUZCOANO 18
EUROPA 34
BBV 1
BCH 2
SANTANDER 3
BNP ESPAÐA 21
BANESTO 5
CATALANA 6
SAN PAOLO DI TORINO 23
ZARAGOZANO 7
CREDIT LYONNAIS 22
BANKINTER 4
BEX 8
AMERICA 9
SUMITOMO 10
TOKYO 24
MIDLAND 11
NAPOLI 25
Dendrogram using Complete Linkage
Rescaled Dista nce Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+- --------+---------+---------+
IBERCAJA 15
BANCAJA 30
HERRERO 13
LAIETANA 28
UNICAJA 27
CA SABADELL 29
POPULAR 12
INMACULADA 16
CAJAMADRID 14
ASTURIAS 26
BANESTO 5
CATALANA 6
SAN PAOLO DI TORINO 23
CREDIT LYONNAIS 22
ZARAGOZANO 7
BBV 1
BCH 2
BNP ESPAÐA 21
SANTANDER 3
BANKINTER 4
MAPFRE 32
BANPYME 33
URQUIJO 17
BARCLAYS, S.A.E. 31
CAIXA 19
CA CATALUÐA 20
GUIPUZCOANO 18
EUROPA 34
BEX 8
AMERICA 9
SUMITOMO 10
TOKYO 24
MIDLAND 11
NAPOLI 25
Dendrogram using Ward Method
Rescaled Dista nce Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+- --------+---------+---------+
IBERCAJA 20
BANCAJA 26
UNICAJA 23
CA SABADELL 25
HERRERO 18
GUIPUZCOANO 28
LAIETANA 24
CAIXA 29
CA CATALUÐA 30
POPULAR 17
INMACULADA 21
CAJAMADRID 19
ASTURIAS 22
EUROPA 34
MAPFRE 32
BANPYME 33
BBV 1
BCH 2
BNP ESPAÐA 8
CREDIT LYONNAIS 9
SANTANDER 3
BANESTO 5
CATALANA 6
SAN PAOLO DI TORINO 10
ZARAGOZANO 7
URQUIJO 27
BARCLAYS, S.A.E. 31
BANKINTER 4
BEX 11
AMERICA 12
MIDLAND 14
SUMITOMO 13
TOKYO 15
NAPOLI 16
Dendrogram using Complete Linkage
Rescaled Dista nce Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+- --------+---------+---------+
IBERCAJA 20
BANCAJA 26
UNICAJA 23
CA SABADELL 25
HERRERO 18
GUIPUZCOANO 28
LAIETANA 24
CAIXA 29
CA CATALUÐA 30
POPULAR 17
INMACULADA 21
CAJAMADRID 19
ASTURIAS 22
EUROPA 34
MAPFRE 32
BANPYME 33
URQUIJO 27
BARCLAYS, S.A.E. 31
BANKINTER 4
BNP ESPAÐA 8
CREDIT LYONNAIS 9
BANESTO 5
CATALANA 6
SAN PAOLO DI TORINO 10
ZARAGOZANO7
BBV 1
BCH 2
SANTANDER 3
BEX 11
AMERICA 12
MIDLAND 14
SUMITOMO 13
TOKYO 15
NAPOLI 16

DENDROGRAMA VARIABLES (WARD) DENDROGRAMA VARIABLES (COMPLETO)
DENDROGRAMA SIN DEPOSITOS/REC.AJENOS DENDROGRAMA CON FACTORES