Logo Studenta

Resumen prueba 2 pdf

¡Este material tiene más páginas!

Vista previa del material en texto

ESTUDIOS CUALITATIVOS: pretenden responder a la pregunta de porqué, se quieren medir cualidades. 
o Razones de porque un cliente prefiere una marca sobre otra 
o Razones de porque un cliente ya no es cliente y abandonó 
o Porque prefieren un producto sobre otro, etc. 
Problema de marketing: 
¿Dónde estarían los estudios cualitativos? 
2: tengo un problema u oportunidad dada por una brecha y para poder entenderla mejor 
y que acción tomar trato de entender a los consumidores para mirar la competencia y al 
medio ambiente. 
¿Qué hago? mirar el punto 2, debido que existe una brecha que quiero aminorar. 
Quiero conocer a los consumidores: ¿quiénes son?, para diseñar mejor las acciones y 
poder probarlas en el mercado. 
 
 
 
 
 
I. Tipos de estudio: características metodológicas 
o Cualitativa: hablamos de entrevista o focus group 
� Variables cualitativas: miro cualidades, atributos que son relevantes para los consumidores. 
� Origen ciencias sociales: psicología, antropología, etc. Este estudio típicamente es hecho por psicólogos, dado que es la ciencia 
más blanda. 
� Método inductivo: no se lo que necesita el consumidor y le voy a preguntar. 
� Información no estructurada: hago preguntas abiertas (necesidades, experiencias, etc-> que ventajas ven en el producto nuevo, 
razones de cambio de banco, etc) 
� Mucha información por encuestado: entrevisto en profundidad a cada uno, quiero que me cuente. 
� Muestras pequeñas: no puedo entrevistar a muchos en profundidad. De aquí se sacan insights. 
� Análisis subjetivo: investigdor debe analizar respuestas largas y requiere de un experto. 
� Bajo costo y tiempo: puede ser armada de un día para otro 
� ¿Conclusivo? 
o Cuantitativa: hablamos de encuesta, quiero cuantificar 
� Variables cuantitativas. 
� Origen ciencias exactas. 
� Método deductivo: planteo hipótesis y la quiero resolver. 
� Información estructurada: póngale nota, diga cuanto estudió, etc. 
� Poca información por encuestado: más superficial, ya que todo está cuantificado, en escalas. Estudios de cantidad: cual es la 
participación de mercado, cuales son las ventas, marcas con preferencia más alta, etc. 
� Muestras grandes. 
� Análisis objetivo: el que sabe de tablas, programa R, etc; puede hacerlo. 
� Alto costo y tiempo: selección encuesta, contratar encuestantes, preguntar encuestas, etc. 
� Conclusivo 
 
De los estudios cualitativos nacen los insights: aparecen temas y me doy cuenta de ciertas cosas, puedo diseñar cambio en mi propuesta de valor 
(4P) y la pruebo cuantitativamente en el mercado (4) 
Segmentación a priori: nace del conocimiento, no de haberme tomado un café con alguien para conocer cosas del negocio que no sabía, aunque 
sea un experto en el negocio. 
Ejemplo: informe Big-Data de lo que estaba pasando con la crisis social no funcionó, ya que el Big Data no sirve para esto, deberían haber 
entrevistado a la gente para conocer en profundidad y entender su relato, lógica, porque razón había protestas y marchas. Gobierno erró en la 
metodología. 
¿De dónde entiendo lo que hay que cambiar pata implementar 4?: de 2. A veces los estudios cualitativos no son conclusivos, pero el objetivo de 
obtener información en mayor profundidad para resolver la brecha u oportunidad si es conclusiva, ya que a partir de esta información obtengo los 
insight y puedo diseñar la propuesta de valor y aplicarla en el mercado. 
 
II. Estudios cualitativos: 
o Focus Group: la entrevista es hecha en un grupo, a todos juntos. 
� Gran ventaja: lo que tu dices me recuerda algo a mi, esa interacción promueve la participación, me acuerdo de una experiencia que tuve. 
o Entrevistas en profundidad: se entrevista uno a uno, de manera separada 
� ¿Por qué querer evitar los Focus Group? 
� Se imponen algunas personalidades: responsabilidad coordinador para controlar esto. 
� Puedo inhibirme: importancia de como está conformado el grupo. 
� A veces las personas que quiero entrevistar son muy importantes y cuesta juntarlas en un día y lugar, por esto se hacen entrevistas 
en profundidad. 
� A veces las personas con las que quiero conversar compiten entre ellas y por lo tanto, no me van a querer decir cosas frente a la 
competencia. 
 
� A veces las preguntas en Focus Group son muy íntimas y es necesario sentirse cómodo para comentarlas, por lo que es mejor la 
entrevista privada. También puede pasar que no quiero que salgan en redes sociales. 
*Problema fundamental de estas dos metodologías: se basan en 2 supuestos 
1. Las personas pueden racionalizar sus sentimientos: pueden pasar del sentir al pensar. Esto no es tan fácil de hacer, racionalizar lo que a 
uno le pasa es muy difícil. 
2. Se supone que lo que racionalicé (si es que logré hacerlo), lo voy a declarar: puede que me declaren algo que no tiene nada que ver. 
Muchas veces no se muestran empresa ni marcas, para evitar sesgos. 
Los 2 supuestos generan errores: ¿cuál es el driver central de muchas personas? Lo que sienten -> no saben porque les gusta algo que compraron, 
no pueden racionalizarlo y muchas veces no quieren declarar. 
Por esto han aparecido: 
o Estudios etnográficos: a diferencia de los declarativos, se basan en la observación o incluyen observación y declaración. 
� Estudios migraciones en Chile: iba a salir con un migrante que va a la feria, así el investigador se da cuenta el camino por el que 
va, a quienes saluda y a quienes no, a que locales entra en la feria, las cosas que le dicen, etc. Va observando y comunicándose 
con una entrevista informal. Como toma mucho tiempo es a pocas personas (10 a 20) 
� Ver como la gente compra. 
o Estudios con medios digitales: usar internet, medios online, como focus group online. 
 
III. Focus Group: 
o Idea de las terapias de grupo de psicólogos. 
o Grupos de entre 8 y 12 personas en sesiones que duran entre 1 y 2 horas. 
o Segmentación de la población objetivo en grupos homogéneos (personas socioculturalmente homogéneas: no juntar ancianos con 
jóvenes-> diferente vocabulario, diferentes opiniones, etc o personas de diferentes grupos socioeconómicos, ya que unas se van a sentir 
superiores y otras no querrán hablar, también segmentar de acuerdo con el uso o compras del producto) 
o Reclutamiento y regalos a los participantes. 
o Lugares cómodos y especialmente diseñados con equipo de video y/o ventanas de un lado. 
o Técnicas proyectivas: para solucionar el problema que las personas no racionalicen, ni declaren. Corresponde a preguntar cosas parecidas 
a lo que quiero saber, sin que la persona se de cuenta de que estoy preguntando. 
Ejemplo: si Coca-cola fuese una persona, como sería, que estudiaría, etc. Mostrar una serie de personas y preguntar cual persona podría 
manejar cada tipo de marca. Estos ejemplos nos podrían mostrar la manera en que piensan las personas, su opinión respecto a la marca. 
o Hay un moderador que juega un rol fundamental: prepara la pauta de la conversación, guía la conversación hacia el objetivo y estimula la 
participación e interacción, analiza los datos y redacta un informe con las conclusiones. 
o La pauta de conversación va de lo general a lo particular: introducción, introducción al tema, preguntas claves (y test de concepto) 
o Hoy en día se usan mucho los FG por internet (analogía clases online: comunicación no verbal) 
o ¿Para qué se usa un FG? Todos son ejemplos cualitativos: extraer información cualitativa 
� Desarrollar causas de problemas y desarrollar hipótesis: causas, (des)ventajas. 
� Conocer y entender al consumidor: ocasiones consumo, uso, necesidades. 
� Desarrollar nuevos productos: ventajas, desventajas, usos. 
� Desarrollar y evaluar publicidad y promociones: atributos, (des)ventajas. 
� Posicionar productos/marcas: atributos diferenciadores. 
� Estudio de uso de productos: usos. 
o Costos de hacer un FG: 
o Tamaño de la muestra: por ejemplo, saber atributos de cámara 
fotográfica 
En el tamaño de la muestra a 55% le importa el precio y 45% no 
le importa. 
Probabilidad si tomo 10 consumidores (son independientes) deque ninguno me mencione en precio: 0,45 𝑜 1 0,55 
Probabilidad de que al menos 1 me mencione en precio: 
1 0,45 
Importancia de precio 55%: seguramente si le pregunto atributos importantes me va a decir precio y también le pueden interesar más atributos. 
 
o Análisis Ex Ante: probabilidad de que un grupo con n personas, un atributo con 
importancia S me aparezca en el grupo (quiero que sea alta):1 1 0,95 
Puedo jugar con ella: fijar n o , ya que tenemos 2 incógnitas y así encuentro o n. 
� Ejemplo: si quiero que todos los atributos que tengan importancia 10% o más 
aparezcan ( 0,1 , reemplazo en fórmula 0,1ny obtenemos n=28, por ende, 
hay que entrevistar a 28 personas, por lo que hay que hacer 3 focus group. 
Probablemente posventa no me va a salir y precio si. Podemos usarlo según 
presupuesto, es decir, número de entrevistados: n=20, entonces p=0,139, es decir, 
todos los atributos que estén presentes en el 13-14% de la población me van a 
aparecer. Esto será con un 95% de confianza, no es absoluto. 
o Análisis Ex Post: seguir haciendo focus group hasta que no entreguen 
información novedosa (hay que hacer por lo tanto al menos 2). Hasta que no 
entreguen nueva información. Lo malo es que no puedo hacer un presupuesto con 
esto, ya que es ex post. 
 
IV. Bulletin Board Groups y entrevistas en profundidad paralelas: de manera asincrónica, no al mismo tiempo conectados, hacen 
preguntas, muestran videos y dan días para responder. 
o Participación asincrónica. 
o 10 a 30 participantes. 
o Respuestas reflexivas, actividades de mediano y largo plazo. 
o Duración: 
� Corta (3 a 10 días): focalizado en un tema, con participación diría. 
� Larga (semanas o meses): tema más amplio, participación semanal. 
o Técnicas: preguntas, encuestas, actividades on-line, actividades off-line. 
o Especialmente útil en B2B: hago el estudio a una empresa, consumidores no son personas, sino que es una empresa. 
o Anonimato de participantes. 
o BBG tienden a ser reemplazados por On-Line Reasearch Communities. 
Ventajas: 
o Piensen bien sus respuestas. 
o No tengo que reunirme. 
o Mayor reflexión de ambas partes: de acuerdo con lo que digan al moderador, este puede hacer más preguntas preparadas de acuerdo 
con lo que respondieron. 
o Moderador puede mandar a hacer actividades: navegar en una página, ir a un supermercado, etc. 
o Persona por internet son más honestas, están dispuestas a declarar cosas que antes no. 
o Menos costos. 
Desventajas: 
o Toman más tiempo. 
o No habrá reacciones espontáneas, del momento (como para chocolates, por ejemplo) 
Estudios etnográficos: no basta con preguntar, hay que observar. 
 
TEXT ANALYTICS: obtener textos de los consumidores. Puede ser audio convertido en texto. 
o Lo juta con estudios cualitativos: extraer cualidades, se orienta a tratar de captar las cualidades. 
o ¿Cómo voy a analizar este texto? Lo que se puede analizar usando test analytics 
� Instancias en área de marketing donde podría tener textos para analizar: redes sociales, review, libro de sugerencias, resultado 
entrevista en profundidad, reclamos, discursos de políticos. 
� Banco Santander tiene sistema donde si tiene un problema llama a box (robot) y usando ciertas técnicas deriva la solución al 
área correspondiente. 
� Encuestas de satisfacción: pregunta de si quiere decir algo más, que agregaría, etc. 
 
Los datos: 
o Análisis de texto aparecen muchos problemas que no están en los datos numéricos Por ejemplo, la palabra porque se puede escribir 
de muchas formas, por lo que el análisis se hace más complicado vs el número 4, que uno siempre sabe que dice y se escribe así. Por esto 
es necesario hacer cleansing. 
Unidad de análisis: 
o Corpus o cuerpo: documentos relacionados entre si. 
o Documento: considerado una bolsa de palabras. Puede ser noticia, reclamo, 
artículo del diario, paper, relato de persona, experiencia, etc. Uno tiene muchos 
documentos: muchos reclamos, paper, etc y al total de estos documentos lo llamamos 
corpus. 
o Palabra: unidad básica del documento. También podemos trabajar con n-grama (de 2 palabras) 
o Cleansing: unir palabras que significan exactamente lo mismo, que la expresión es la misma. Como sinónimos, homógrafos (palabras que 
se escriben igual, pero significan algo diferente), abreviaciones, errores de ortografía, modismos, contexto, homogenizar terminaciones 
racamentos compuesto
(el supermercado, los supermercados: quiere decir los mismo, pero el computador lo toma como distinto), eliminar palabras sin sentido 
(artículos, conjunciones), etc. 
o Traducción: país con muchas lenguas diferentes, en twitter van a escribir diferentes. Si quiero analizar debo traducir y homogeneizar 
o Ejemplo: Aguas Andinas pescó todos los comentarios de twitter y analizó todas las palabras de cada documento dentro de un corpus para 
el caso que el agua salía contaminada. 
 
Gráficos de palabras ejemplo aceite de oliva: las más grandes son las que tienen mayor frecuencia 
o 60 personas declaran lo primero que se le viene a la mente con la 
frase aceite d eoliva. En total 153 palabras, el nº máximo de palabras de 
una persona es 17 
o Text analytics: obtener bolsa de palabras (no hay frases) 
o 60 documentos, correspondientes a 60 alumnos 
� Doc virgen España comida calidad aceituna 
� Doc aliño aceituna ensalada España sano dieta 
� Doc español aceituna ensalada virgen extra virgen 
� Doc ensalada comida sano aceite calidad 
� Doc aceituna virgen sano ensalada 
 
 
o Para cada Doc y palabra: tiene cuantas veces es 
nombrada. 
o No hay alta frecuencia, ya que pidieron palabras. 
*Cuando el texto es más grande hay mayor frecuencia 
de las palabras 
 
A partir de la matriz se pueden hacer 3 análisis: 
 
1. Análisis TF (term frequency) IDF(invers document frequency): a partir de la matriz anterior construyo TF-> igual pero en términos 
relativos 
 
o Tabla 1: la idea e spoder determinar en cada documento 
cuales son los términos o palabras con mayor frecuencia. El 
problemas es que hay palabras que todo el mundo menciona (como 
ensalada en el primer caso), por lo tanto todos los documentos van 
a tener una alta frecuencia y de alguna manera no discrimina las 
características de un documento. Palabras más características de 
cada documento 
o Tabla 2: multiplicar TF*IDF. Es lo que usa Google para 
mostrar páginas cuando uno pone una palabra y busca. Va a buscar 
páginas donde aparezca con alta frecuencia la palabra (TF alto) y 
que sea una de las pocas que contiene esta palabra (IDF alto). BCI 
usa esto para detectar personas que puedan necesitar crédito de 
consumo o de vivienda (por ejemplo personas que hablan en redes 
sociales de irse de vacaciones y el banco les puede ofrecer un pack, 
descuento, créditos para que se puedan ir. 
o Por TF: me interesan palabras muy mencionadas, porque son importantes. 
o Por IDF: me interesan palabras poco mencionadas, porque son características de ese documento. Si quiero individualizar o caracterizar un 
documento. 
o Mi estrategia podría ser relacionar aceite de oliva con la palabra sano y ver la frecuencia de esta. 
o ¿Dónde puedo usar TF-IDF?: para sacar información, para acciones de marketing, etc. 
Índice IDF: 
Análisis alternativos: 
o Fuentes de información para text analytics 
o Tipos de análisis: TF-IDF me sirve para hacer análisis vertical y horizontal-> 
� Palabras correlacionadas 
� Segmentos de personas: persona 1 ¿a quién se parece?, en el caso de que tuviera ue 
agrupar-> se parece al 4. La frecuencia ajustada que tiene ciertos término en su 
documento, son similares. 
� Personas interesadas en: ¿qué personas están interesadas en dieta? 2 
� Predicción de eventos: darme cuenta que ciertas cosas están ocurriendo-> accidente, 
caso agua contaminada, etc. De esta manera más rápida. 
� Topic Modelling y análisis de sentimiento: son las más relevantes que se hacen con text 
analytics, es más profundo que TF-IDF. 
*Problema TF-IDF: es una matriz demasiado grande. El topic modelling ayudaráal análisis. 
aEngraraaceituna
aceitunas
i queprimerosenace
waempalabrasesvirgen www.enaoiaparececaaapaiabra
noayudaacaracterizarmanumentoenespecifico
Laspaiabrasque etiogateríaelvaiorcuandolaaparecenenvaos paiabraespocolosarmennos
mencionada
ug.opaase.mupequeño1 onorte
eso.mn
bajo
2. Topic modelling: tengo un documento, donde hay un tema de fondo que contiene subtemas del tema. Al mismo tiempo que miramos 
este documento se miran muchos más donde pasa lo mismo 
 
o Lo que saco de este documento y muchos más (dentro del mismo 
corpus: por ejemplo columnas del ciario el mercurio área economía y 
negocio). 
o Puede ser el resultado de una pregunta en un FG y pido que me 
hablen de una experiencia de paseo a Valparaíso y quiero posicionar este 
lugar como destino turístico. 
o Latent Dirichlet Allocation: el modelo junta muchos documentos y 
establece que ciertas palabras se repiten mucho y hace los tópicos. 
o Tópicos: palabras que se repiten y están relacionadas entre si, tienden 
a ir juntas. 
 
 
Tópicos aceite de oliva: Probabilidad 50 encuestados: análisis de cada persona y predominancia de los 
tópicos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3. Análisis de sentimiento: ver si un comentario que me hicieron es positivo, negativo o neutro. 
Metodologías: 
o Basado en diccionario: pesco todas las palabras del diccionario y a las palabras con connotación le pongo , neutra y negativa -1. 
Pesco el documento y le pongo la nota, según eso veo el puntaje total. 
Problemas el tono puede ser negativo, no estuvo buena el no es negativo y el buena es - 
Lollapalooza 2017: una encuesta realizada a 1274 asistentes al festival Lollapalooza pregunta 
por sugerencias para hacer mejoras. En total el nº de palabras es 3.966 
Frecuencia de palabras: 
 
Tópicos: en lugar de los 1274 asistentes, con este cuadro me doy cuenta de las áreas a 
mejorar 
 
Probabilidades de los tópicos de 50 personas: puedo hacer segmentación con 
esto, a partir de las recomendaciones que ellos me hicieron. 
 
eternas
oonerno
comoestaenmaromen amorsena.am maao.aemioemismo presupuesto
encación
comoiaoou.net t.aowoinawein.enea.ueuer.namiaag.net awww.eaaapor
amosawa.me
psaoiemporra.mx
o Basado en modelos estadísticos: experto pesca documento y luego de leerlo lo clasifica como +, - o neutro. Luego de varios documentos, 
hago un modelo según las palabras del documento y según las clasificaciones de los expertos lo clasifico en +, - o neutro. 
 
Caso Cyber Monday 2013: 
 
 
 
 
Análisis por empresa: 
 
 
 
 
 
 
 
 
 
 
 
 
 
DATOS DE PANEL: datos a lo largo del tiempo, muestras son siempre los mismos individuos. 
 
I. Tipos de estudios cuantitativos: 
Queremos varianza baja: cuando trabajo con una muestra tengo estimaciones (no población entera) y mientras más chica es la varianza, la 
estimación es más precisa. Ganancia de tener mejor precisión (con muestra más grande o varianza más chica se obtiene mejor precisión). 
o Estudios de corte transversal: los hago una sola vez y no me interesa hacerlos de nuevo. 
¿Cuáles son los que voy a querer hacer una sola vez? Diseñar un producto, impacto de una acción (bajó el precio y quiero ver el 
impacto en las ventas, promociones, etc) 
o Estudios longitudinales: quiero medir lo que está pasando a través del tiempo. Estudios de satisfacción, tipo 1 y a veces tipo 2. Lego, 
por ejemplo, invitaba a los niños a jugar a sus salas y los observaban, diseñando nuevos juegos de acuerdo con su comportamiento 
(diseñaban constantemente) 
� Panel: muestra fija (sigo a los consumidores a través del tiempo) 
� Muestras independientes: cada vez que hago estudio es con muestras independientes (siempre diferentes como caso 
ISKON). Encuesto, sigo u obtengo información de diferentes consumidores. La encuesta casen es un estudio longitudinal de 
encuestas independientes. 
Hay tendencia a usar paneles cada vez que podamos: 
¿Qué ventaja tienen? 
o Seguimiento de la muestra. 
o Se puede medir la transición de las personas. 
o No siempre puedo usar paneles (como en un templo, siempre diferentes visitantes) 
2 ventajas particularmente importantes: 
o Cuando quiero calcular G: como aumentan y cambian las ventas, de como aumenta la satisfacción de mis clientes, como aumenta el 
consumo de un período a otro-> tengo varianza menor de los G, lo que significa error estándar más chico y por ende, mayor precisión. 
𝑉 𝑉 𝑉 2𝑐𝑜 , 
Si consumidores son independientes la 𝑐𝑜 0 y la varianza aumenta. Cuando tengo panel, los individuos están correlacionados y hay 
𝑐𝑜 0, por lo que disminuye la varianza del G. 
o Puedo mirar las transiciones: puedo mirar si un consumidor la semana pasada compró una marca, a que marca se movió. Puedo saber los 
totales de marca 1,2 y 3, siempre. Pero no puedo saber porque aumentó la marca 3 siempre, sino que solo con los paneles 
 
Caso gaseosas: habla de cohorte, sigue a los grupos a través de los años, pero no a cada individuo. 
twitter.iaiaaeianermonaay.sonreian.ua
abermonaayabecomenerayunadearaspaiabras
resuenen resuenan
� Desventajas: mayor costo, algunos consumidores pueden abandonar el estudio, complicados porque hay que seguir a la misma persona a 
lo largo del tiempo y estas cambian su teléfono, se cambian de casa, cambian la cuenta de twitter, etc. Dejan de estar presentes y ya no 
las puedo seguir encuestando. 
 
Paneles de consumidores más típicos: el que tiene que ver con la TV, el raiting (people meter)-> algunos hogares que en su TV tiene un sistema de 
medición que permite ver el canal que están viendo. El panel Homescan Nielsen y la competencia de este el Latin Panel que hace exactamente lo 
mismo. 
 
II. Medidas de desempeño de marca (BPM): Homescan Nielsen 
o Panel de 2000 hogares a nivel nacional con información del comportamiento de compra de los consumidores en productos de consumo 
masivo. 
o Segmentación: estrato socioeconómico, edad de la dueña de casa, número de personas en el hogar, presencia de niños. 
o Cada hogar recibe un minicomputador o scanner con lector de código de barras de última generación. 
o Por cada viaje de copra, se registran todos los productos con código de barras. También se registran productos a granel y venta directa. El 
scanner transmite, automáticamente, una vez a la semana. 
o Muestra balanceada y representativa de la población. 
o Paneles siempre tienen rotación, ya que se sigue por mucho tiempo la muestra va a terminar siendo puros viejos y se necesita analizar los 
nuevos hogares. Debe haber rotación. 
o Cada viaje de compra registra: 
� Lugar de compra (canal y cadena). 
� Monto total de la compra y método de pago. 
� Quién realizó la compra y si fue acompañada y por quién. 
o Para cada código de barra se registra: 
� Cantidad comprada. 
� Promoción: gramos extras, 2x1 / 3x2 / 4x3, pack de regalo, descuento. 
� El precio pagado es imputado posteriormente 
 
Caso arroz Tucapel: 
Medidas de desempeño de marca Tucapel 
Participación de mercado 47
188 25% 
Penetración 
 
Categoría 1: porque todos los hogares compraron alguna marca de arroz 
Marca: cuantos hogares en este trimestre compraron 
arroz Tucapel 
80% hogares compra Tucapel 
100% leales 0: a los hogares les gusta variar las marcas, no compran la misma marca, ya 
que hay diferentes ocasiones de consumo. 
Frecuencia 
de compra 
 
 
 
Categoría: compradores de marca, cuántos compran 
de la categoría 
188 30⁄ 6,3: en total se vendieron 188 y compraron 30 hogares, por lo que 
cada hogar en promedio compró 6,3. 
¿Cuántos compran de la categoría los compradores de Tucapel? 
188 32 24⁄ 6,5: los compradores de Tucapel consumen más arroz en 
promedio que los no compradores de Tucapel, son más pesados. 
Si la compra promedio entre todos los que compran la divido en la penetración 
de la marca: 47 30⁄ 80%⁄ 2-> nos da la compra promedio entre los que 
compran Tucapel. 
Marca: compra promedio de la marca 47 24⁄ 2: compra promedio entre los que compran Tucapel 
47 30⁄ 1,6: compra promedio contándolosa todos 
100% leales: compra promedio de los que son 100% 
leales 
0: no hay 100% leales 
Share requirement: participación de mº de Tucapel, pero solo entre 
los que compran Tucapel. 
47 188 32⁄ =30%: algunos consideran que es mejor indicador de la fuerza 
de la marca o lealtad vs la participación de mº. 
3 problemas participación de mº: 
1. Pueden haber algunos hogares que no tengan acceso a comprar: 
problema de distribución (puede que en región no se distribuya la 
marca Tucapel), no pueden comprar y eso lo considero en la 
participación de mº y no en share requierement. 
2. No conoce la marca. 
3. Simplemente por sus preferencias. 
*Share requirement aísla estos problemas. 
Switching: ¿cuántos compradores de 
T capel también compran sir e 
para ver con quien compito 
Miraflores 
Aruba 
17 24⁄ 71% 
 
3 24⁄ 13% 
 
Modelo de Dirichlet: nº de compras en un período de tiempo-> posisson 
 
x xx x1 1
T Txt
comprasdelhogar
espoisson
Análisis de matrices de Switching o transición: categoría mantequillas-> cambio de las diferentes marcas. Mirar como se producen las transiciones y 
el panel permite verlas. 
o Variaron las marcas de 2001 a 2002 mirando la participación de mº: cayeron 
fuerte las marcas más pequeñas. 
o ¿Qué ocurre al interior de la matriz de transición? Se lee: del total de 
consumidores Soprole (40%) a donde se fueron al año siguiente-> 72% permaneció en 
Soprole, 12% a Nestlé, 8% a Parmalat y 8% a otros 
o ¿Qué análisis se pueden hacer? 
� Lealtad de la marca: la veo en la diagonal, en los que permanecen, los que se 
mantienen en la marca. 
� Atracción: capacidad de atraer consumidores, la veo en los que cambian de esa 
marca de un año a otro (vertical: sin la de esa marca) 
Atracción Soprole: 21% ∗ , %
%
15% ∗ %
%
17% ∗ , %
%
17% Atracción Nestlé=11% Atracción Parmalat=8% 
Soprole es la marca con mayor lealtad (retiene consumidores en un 72%) y mayor atracción (atrae consumidores en un 17%). 
o ¿De qué depende esta matriz de transición?¿Por qué 72% en Sorpole?: de las acciones de marketing tanto para atraer y retener a 
consumidores y de las preferencias (acciones tienen impacto sobe las preferencias, cambios y que consumidores sean más leales y atraer 
consumidores de otras marcas). Como las acciones de marketing se manifiestan en las preferencias de los consumidores de permanecer 
en la marca o moverse a otra. 
St: vector participación mº año t 
Pt: matriz de transición año t. 
Suponemos Pt constante: no es totalmente correcto, ya que las empresas realizan acciones de marketing constantemente. 
𝑆𝑡 𝑃`𝑆 : puedo proyectar cuales serán las participaciones de mº de estas marcas en el futuro. Si t-1 es 2002 voy a calcular St de 2003. 
Gráfico mantequilla: si todas las marcas siguen haciendo lo que han hecho hasta ahora, Soprole se va a mantener casi constante, Nestlé va a crecer 
mucho (acción de marketing exitosa: de 9,5% a 23,6%, va a crecer condicional en que la matriz P se mantenga), Parmalat va a crecer y los chicos 
van a decrecer de 41,5 a 19,3% (muchos van a desaparecer, quedando principalmente las 3 primeras marcas) 
Podemos modificar valores de la matriz, por ejemplo si una marca comienza a ser exitosa. 
Si todos siguen haciendo lo que han hecho hasta ahora, Nestlé se va a llevar 2/3 de la torta (mº) y 
Parmalat 1/3. Dado esto Parmalat quiere arreglar esto y aumenta la lealtad de 57% a 66%, pero deben 
disminuir las lealtades de las otras marcas (la sumatoria debe ser 100). 
0,12 0,16 0,66 0,06: en la medida que Parmalat retiene más consumidores, la de las 
demás marcas disminuye. 
Ahora Parmalat aumenta de 9% a 22% (antes a 18%): esto le reporta 4% (gana 4% de participación de 
mº). ¿Debe Parmalat hacer esto? Dependiendo de los costos del programa de retención de clientes. Si 
4% > costo de implementación. 
¿Qué pasaría si Soprole logra retener a los clientes en un 100%? Soprole se queda con todos los 
clientes y todos los que atrae se quedan en Soprole. Retiene a todos y sigue atrayendo de las otras 
marcas. Clientes de otras marcas convergen a 0. 
¿Cómo puedo mirar los que consumen Soprole? Quiero analizar estos clientes: poner en la 
participación de mº del año 1 100% en Soprole (1) y 0 en los otros. 
No importa la participación de mº hoy, siempre la transición me va a llevar a la misma solución: tiende a un equilibrio, donde las participaciones de 
LP no se ven afectadas por el punto inicial. Quiere decir que las participaciones de LP están totalmente dominadas por la matriz de transición. Solo 
fijarnos enla atracción y retención, ya que estas determinarán la participación de mº en el LP. 
 
III. Modelo de frecuencia (total de compras en una categoría): Poisson (ocurren eventos en un intervalo de tiempo y estos son 
independientes)-Gamma 
 
o La frecuencia de compra en un período, dada la intensidad o tasa de compra, tiene distribución Poisson 
𝑛⁄ ∼ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 
Nº de compras dado es Poisson: es específico para cada hogar. 
: frecuencia de compra 
o La intensidad o tasa de compra se distribuye, a través de los clientes, según la distribución: parámetro (tasa de compra) es diferente para 
cada hogar, la que tiene distribución Gamma (hay grandes y chicos) 
~𝐺𝑎𝑚𝑚𝑎 𝑟, 𝑠 
𝐸 𝑟 𝑠⁄ 
𝑉 𝑟 𝑠⁄ 
Para poder predecir el comportamiento de los consumidores calculo r y s: son parámetros que debo calcular y son específicos para cada 
producto, para cada categoría. 
Binomial Beta: controla la marca que compra 
 
Factor inflación varianza (FIV): indicador de cuan heterogéneos son los consumidores. Mientras mayor es s, más homogéneos son los 
consumidores. 
𝐹𝐼𝑉 1 1 𝑠⁄ 1 
Ejemplos distribución Gamma: 
soo
oifeo
soo
parn.a.paom.anoaoorcomoseproauceniasnansioion.ae 1añoamaina go.q.snvarias
zoos
sana
40
 
o ¿Qué pasa si los hogares consumieran en torno de 10 
intensidad de compra?: muy homogéneos, s nº muy grande y así 
tendrían una 𝑉 muy pequeña. El r tendría que ser 10 veces 
más grande, ya que 𝐸 10. Muchos hogares están 
concentrados en torno a una tasa de 10. 
o Caso límite en que la varianza sea 0: habría peak absoluto y 
consumidores serían absolutamente iguales y la parte Gamma 
desaparece. Tendríamos igual para todos los hogares. Evidencia 
empírica muestra que esto no ocurre, consumidores son 
heterogéneos y es necesaria la parte Gamma. 
 
 
 
 
 
 
Estimación de parámetros: observar consumidor en un cierto período de tiempo y observar su comportamiento. Para trabajar con este modelo 
necesito calcular r y s. 
o Máxima verosimilitud: la probabilidad de que un cliente realice n compras es: se puede maximizar por MV y econtrar r y s 
𝑝 𝑛
Γ 𝑟 𝑛
Γ 𝑟 Γ 𝑛 1
𝑠
𝑠 𝑇
𝑇
𝑠 𝑇
, 𝑛 0,1,2,3, … 
 
o Método de Momentos (forma usual de hacerlo): la penetración de la categoría y las compras promedio (incluyendo a los que no 
compran) son: 
𝑃𝑒𝑛𝑒𝑡𝑟𝑎𝑐𝑖ó𝑛 𝑜𝑏𝑠𝑒𝑟 𝑜 𝑢𝑛𝑎 1
𝑠
𝑠 𝑇 𝐶𝑜𝑚𝑝𝑟𝑎𝑠 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑜𝑏𝑠𝑒𝑟 𝑜
𝑟
𝑠 𝑇 
T es el tamaño tiempo de observación de la muestra. Usualmente T = 1 trimestre. 
 
Análisis del modelo: 
o Para un consumidor promedio en un período de tiempo futuro T* 
𝑃𝑒𝑛𝑒𝑡𝑟𝑎𝑐𝑖ó𝑛 1 𝑝 0 1
𝑠
𝑠 T ∗ 𝐶𝑜𝑚𝑝𝑟𝑎𝑠 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜
𝑟
𝑠 𝑇 ∗ 
 
𝐶𝑜𝑚𝑝𝑟𝑎𝑠 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑐𝑜𝑚𝑝𝑟𝑎𝑑𝑜𝑟𝑒𝑠
𝑐𝑜𝑚𝑝𝑟𝑎𝑠 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜
𝑝𝑒𝑛𝑒𝑡𝑟𝑎𝑐𝑖ó𝑛 
𝐶𝑜𝑚𝑝𝑟𝑎𝑑𝑜𝑟𝑒𝑠 𝑅𝑒𝑝𝑒𝑡𝑖𝑑𝑜𝑠 𝑐𝑜𝑚𝑝𝑟𝑎𝑛 𝑢𝑛 𝑡𝑟𝑖𝑚𝑒𝑠𝑡𝑟𝑒 𝑢𝑒𝑙 𝑒𝑛 𝑎 𝑐𝑜𝑚𝑝𝑟𝑎𝑟 𝑒𝑙 𝑠𝑖𝑔𝑢𝑖𝑛𝑡𝑒 2 𝑃𝑒𝑛𝑒𝑡𝑟𝑎𝑐𝑖ó𝑛 𝑇 𝑃𝑒𝑛𝑒𝑡𝑟𝑎𝑐𝑖ó 2𝑇 
 
o Para un consumidor que realizó n compras en un período previo de tamaño T, los resultados anteriores se aplican con los parámetros. 
𝑟 ∗ 𝑟 𝑛 , 𝑠 ∗ 𝑠 𝑇 𝑝𝑒𝑟í𝑜𝑑𝑜 𝑑𝑜𝑛𝑑𝑒 𝑜𝑏𝑠𝑒𝑟 é 𝑙𝑎𝑠 𝑛 𝑐𝑜𝑚𝑝𝑟𝑎𝑠 
 
MODELOS DE ELECCIÓN DE MARCA: elección de marcas elegibles, que estén disponibles. 
o Personas eligen una marca respecto a la utilidad que le reporta la marca. 
o Indicador más importantede una marca: la participación de mº (penetración, frecuencia de compra, ventas: son insumos de la 
participación) 
o ¿Qué hace que los consumidores elijan una marca y no otra? Cuando lo hacen están formando participación de mº. 
 
I. Modelo logístico: 
o Para un individuo i y una marca j se define la utilidad: 
𝑈 𝑈´ 𝑒 
𝑈´ 𝑏 𝑏 ⋯ 𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑞𝑢𝑒 𝑝𝑢𝑒𝑑𝑜 𝑚𝑒𝑑𝑖𝑟 𝑒𝑠𝑡𝑜 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑛𝑑𝑜 𝑒𝑛 𝑚𝑖 𝑚𝑜𝑑𝑒𝑙𝑜 
� 𝑒 : todo lo que no estoy midiendo. 
� Individuos cuando eligen una marca calculan su utilidad. Suponemos que los individuos son racionales, eligen la marca que les da mayor 
utilidad. 
� Puedo tener más variables medibles y puedo sacar también, poniéndola en el residuo. 
𝑈𝑡𝑖𝑙𝑖𝑑𝑎𝑑 𝑡𝑜𝑡𝑎𝑙 𝑢𝑡𝑖𝑙𝑖𝑑𝑎𝑑 𝑚𝑒𝑑𝑖𝑏𝑙𝑒/𝑝𝑟𝑒𝑑𝑒𝑐𝑖𝑏𝑙𝑒 + (residuo) 
� La utilidad medible: depende de ciertas variables que yo podría determinar. Ejemplo: si compro una cerveza el precio, sabor, calidad, son 
variables predecibles, observables que yo puedo medir. Se podrá calcular. 
� Residuo: elementos aleatorios, inesperados, generan en ese momento mayor utilidad y voy a elegir una marca diferente a la que indica la 
utilidad medible. Ejemplo: al ir a comprar la cerveza me topo con un amigo y me dice que compre una sobre otras y esto me hace 
cambiar de opinión. 
o A partir de la utilidad predecible se definen probabilidades de elección del individuo i: 
𝑒 ´
∑ 𝑗 𝑒 ´
, 𝑗 1,2, …. 
es pmucnosnogaresconxpequeno.p.oos.n.reiawamenx.noconsumidoresconsumenmenosy.onma.sn.moge.me
E
naxunaaien.acamiaaaaen.gare.com
www.sina.ercaae.o
p
inogaresconsument
imayornererogeneiaaa
ew.iovw.ro
maeener
Suponemos dos marcas con diferentes utilidades: 𝑈 10 𝑒 y 𝑈 20 𝑒 
¿Cuál de las dos marcas se va a elegir? Depende del error, pero es más probable que elija b. El residuo tiene esperanza 0, pero puede ser mayor en 
una marca que en otra. No podemos calcular los errores del e, porque no puedo observarlos. Cuando e es muy bajo, casi seguro de que se va a elgir 
b. 
¿Cuál es la probabilidad de que 𝑈 𝑈 ? 𝑃 𝑈 𝑈 𝑃 10 𝑒 20 𝑒: necesito saber la distribución de probabilidad del e. Lo lógico es 
pensar que 𝑒~𝑁𝑜𝑟𝑚𝑎𝑙 (uno esta hablando de un modelo Probit). Problema: estas probabilidades son difíciles de calcular con la distribución 
Normal, por lo que usaremos el modelo logístico=logística (parecido al Normal, pero es fácil de calcular el e) 
� Marcas tienen diferentes utilidades y estas dependen de ciertas variables observables que conforman la utilidad predecible y variables no 
observables que conforman la utilidad no predecible. 
� Se pueden obtener productos con utilidad negativa: la utilidad en si solo ordena las preferencias, la utilidad en si no significa nada, la 
comparo con las otras utilidades 
 
Ejemplo: diapositiva 4 de elección de marca. 
 
Los Datos: muestra de individuos donde observo que marca eligió cada uno. Si esto no está, no puedo trabajar con este modelo 
o La variable dependiente tiene la forma 
𝑌 1, 𝑠𝑖 𝑗 𝑒𝑠 𝑙𝑎 𝑜𝑝𝑐𝑖ó𝑛 𝑒𝑙𝑒𝑗𝑖𝑑𝑎 𝑝𝑜𝑟 𝑒𝑙 𝑖𝑛𝑑𝑖 𝑖𝑑𝑢𝑜 𝑖0, 𝑒𝑛 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜 
o Las variables independientes tienen la forma 𝑋 : dependen del individuo y de la marca. 
o Modelo no tiene constante global, pero si puede tener constantes por marca, las cuales se representan con las variables de la forma 
𝑋 1 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑗 0 𝑒𝑛 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜 
Ejemplo para el caso de que no tiene constante global: U = -2P + e -> no hay constante. ¿Qué pasaría si le agrego una constante? Todos tienen igual 
constante y cuando vaya a ordenar va a quedar igual el orden, ya que subí la U de todos. Si le sumo 10 (constante: no me ayuda a ordenar y no 
cambia las ) a todas las U´¿qué pasa con ? Se anulan, queda igual 
 
Ejemplo modelo logístico: 
Participación mº A: 
 
 
 
 
Participación mº B: 
 
 
 
 
Como se relaciona una variable X, como la calidad, con la : 
 
o La calidad con la U tiene relación lineal. 
o Si b es mayor la pendiente crece, el paso de π muyr baja a muy alta 
ocurre en un tramo menor. Es más sensible la relación entre calidad y . 
 
Quiero saber que opina el consumidor y lo que efectivamente compró: 
 
 
 
 
 
 
 
� Proporción de clasificaciones correctas: consumidor 1 
efectivamente compró A y modelo dice A, el 2 compró B y modelo dice B y el 3 compró B y modelo dice C (ocurre por el error, variables 
que no han sido consideradas y a este le importan otras variables que están en el error) 
caiiaaaperabiaaxcromumoiorparaoma.ca
unaconiasrespuestasGoes ycortasprobabilidadescoeficiente preteribusicomoreparentascomprasiosinawiavos
Gastas.si.ws 3 so.ruengüiar s.o.esmarcan z.o.es vaienwao.sooto.aato.w.o.aasiescomosiwu.amiaiemew.ws4os
amarran.am
xmen.ru
i aaiasenarsinoiaa amenvencauaciawww.xra.piaoso significanarena
wwwes nomen.sntoma.es
ewww.esseesnman
sos.o.si 1unos
maten.empreawayarmarraen.ua
� Constantes de marca: b=-1 -> cada vez que el individuo se enfrenta a la marca A, su utilidad disminuye en 1, cuando se enfrenta a B la 
utilidad aumenta en 2 y cuando se enfrenta a C, no cambia la utilidad. Esto es el valor de marca, este modelo permite calcular el valor de 
marca (ver los valores de las marcas y cuanto vale cada una). 
� La marca solo por existir y ser la marca A vale -1, la B vale 2 y la C vale 0. 
� Orden de valor: B>C>A 
� ¿Cómo habrían sido si dejaba fuera la marca A? A=0, B=3, C=1 (se mantienen las diferencias) 
Ejemplo: diapositiva 9. 
 
II. Estimación y análisis del modelo: como se calculan los coeficientes b 
o Estimación (Máxima Verosimilitud) 
o Error estándar de coeficientes y test de hipótesis (si coeficiente es 0 o no, si es significativo): similar a regresión clásica. Puedo calcular los 
estadísticos T. 
o Bondad de ajuste: 
� Estadígrafo 𝑅 1 𝐿𝐿 𝐿𝐿⁄ 
� 𝐿𝐿 : función verosimilitud modelo. 
� 𝐿𝐿 : función verosimilitud solo con constantes de marca 
� ¿Cómo sería modelo base que solo tiene la constante? Si 𝐿𝐿 6 𝐿𝐿 15: mi modelo es mejor que solo las 
constantes de marca. 𝑅 1 6 15⁄ 60% 
� Clasificaciones correctas: ¿cuántas clasificaciones correctas me da el modelo? 2/3 en ejemplo calidad. 
o Análisis de valor de marca: analizar cuanto valen las marcas. 
 
Ejemplo estimación máxima verosimilitud: 
o Calcula el b=0,5 de manera que las (de lo que yo observé, de lo que efectivamente hizo cada consumidor) de lo que estoy observando 
las voy a maximizar. Lo maximizo cambiando el b: saco Ln(Pr) solo de y luego maximizo. 
o No hay restricciones para el coeficiente b. 
o Las constantes de marca no ayudan a mostrar lo que hay que demostrar, son análogas, quedaría igual. 
o En el ejercicio de arroz: la probabilidad depende de 2 parámetros (r y s). Pongo Ln, sumo y maximizo en función de r y s, así obtengo los 
parámetros de verosimilitud. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejemplo supermercados: una muestra de 169 dueñas de casa de la comuna La Florida evalúan distintos supermercados en 4 atributos. 
Adicionalmente, los encuestados declaran el supermercado en el cual realizaron la última compra grande 
o Factores más relevantes para dueñas de casa: precio y cercanía (ya 
que la mayor elección es Líder y estas son las mejores variables de este 
supermercado). 
o Modelo de elección de marca tiene 2 supuestos: 
1. Coeficientes de todos los consumidores son iguales: para todos los 
consumidores el precio no vale mucho, para todos Líder es la marca de mayor 
valor. Los consumidores son homogéneos en sus preferencias, le dan igual 
peso a los diferentes factores. Cuando sabemos que las preferencias son 
heterogéneas, estimamos en diferentes segmentos (ancianos, jóvenes, nivel socioeconómico, etc). Este supuesto no es cierto, ya que hay 
algunos que valoran mucho la marca Jumbo, a otros que les importa el precio, por lo que el supuesto es muy fuerte. No hacemos 
segmentación, sino que estimamos un modelo que es para todos igual. Esto se podría resolver haciendo estimación para diferentes 
segmentos.2. Independencia de alternativas irrelevantes (IIA): si una marca se retira del mº, su participación es repartida proporcionalmente entre las 
otras. 
pioquequivamenteniaeroniaconsumaores
masa
sina.enasowerieagoseib.o.smo.ms
mmaansaoimiIma
masamaximizaiobservado
waueomenooweoo.semaximizar
anaemiainmoveza
notasqueponenlas enpromedio maymprar
Estimación modelo supermercados: 
o ¿Cuál es la variable mas significativa? ¿La variable más importante?: 
se mide con el estadístico z (en valor absoluto) o valor p más 
pequeño. En este caso es cercanía. 
o 𝑅 0,459: está bien, pero podría ser más alto. 
o Clasificaciones correctas 64%: es un poco bajo, en general uno quiere 
70%. Para sacarlo hay que ir consumidor por consumidor, viendo 
realmente lo que hicieron y lo que calculó el modelo. 
o Constantes de marca ¿qué puedo concluir?: Líder es la que más vale, 
luego Jumbo y entre las representadas son todas bien similares. Es 
decir, esta Líder y luego las otras. Bien diferentes a 0, que es el valor 
de marca de Líder, son todas las demás negativas y estadísticamente 
significativas. 
o Ejercicio: si todas las variables fuesen iguales (todas las marcas tienen 
igual variable general, calidad, precio y cercanía. Constantes globales 
se anulan y solo me quedo con constante de marca), la participación 
de mº serían los indicdores valor de marca 
 
III. Independencia de alternativas irrelevantes (IIA) 
 
o ¿Cómo serán las participaciones de mº si C se retira del mº?: la marca C ya no 
existe, por lo que se verá como repartir el 30%. 
Si la marca C es muy similar a B, se va a ir a etsa última. La participación de mº de una 
marca que sale del mº lo más lógico es que se reparta en la marca más similar. Se va a 
repartir en proporción 50%-20% entre A y B 
Participación A: 50% + 30%(50/70)=71% 
 
Casos donde se podría cuestionar este modelo: Bebidas Cola, transporte, elecciones políticas. 
Ejemplo: hay 3 marcas-> Coca Cola, Fanta y Pepsi Cola. Coca Cola es similar a Pepsi Cola. Si Pepsi se retira del mº casi todo se va a Coca Cola, pero el 
modelo señala que 30% se iría a Fanta, lo que no es así. No se va a repartir proporcionalmente como sugiere el modelo. 
Solución: modelos anidados 
2 𝑜𝑝𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑙𝑖𝑗𝑜 𝑒𝑛𝑡𝑟𝑒 𝑏𝑒𝑏𝑖𝑑𝑎 𝐶𝑜𝑙𝑎 𝐹𝑎𝑛𝑡𝑎𝑆𝑖 𝑒𝑙𝑖𝑗𝑜 𝐶𝑜𝑙𝑎 𝑒𝑜 𝑒𝑛𝑡𝑟𝑒 𝐶𝑜𝑐𝑎 𝐶𝑜𝑙𝑎 𝑃𝑒𝑝𝑠𝑖 
 
2 𝑜𝑝𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 𝑒𝑙𝑒𝑐𝑐𝑖𝑜𝑛𝑒𝑠 𝑝𝑜𝑙í𝑡𝑖𝑐𝑎𝑠 𝑖 𝑞𝑢𝑖𝑒𝑟𝑑𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎𝑠𝑖 𝑒𝑙𝑖𝑗𝑜 𝑖 𝑞𝑢𝑖𝑒𝑟𝑑𝑎 𝑒𝑜 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 2 𝑐𝑎𝑛𝑑𝑖𝑑𝑎𝑡𝑜𝑠 𝑝𝑜𝑟 𝑐𝑢𝑎𝑙 𝑜𝑡𝑎𝑟 
 
AYUDANTÍA: 
 
Caso medios transportes 
 
El modelo es para personas que pueden optar entre auto y metro. 
La elección que hacen personas que van a su trabajo y que pueden ir en auto o en metro. Ellos eligen una de las dos modalidades. 
El modelo considerado incluye dos variables: 
1. Tiempo: cuanto demoro en ir a mi trabajo usando el auto o metro 
2. Constantes de marca: solo aparece la constante del metro y la del auto no aparece, ya que esta es la referencia (totalmente arbitraria), lo 
que significa que automáticamente la constante del auto es 0 y la del metro es la que aparecerá en la estimación. Si tengo ambas 
constantes tendría algo así como la constante global, o que no funciona en este modelo, ya que las utilidades en valor absoluto no tienen 
sentido, lo que importa son los valores relativos y el orden de las magnitudes y la magnitud de la diferencia del auto y el metro. 
 
a) ¿Qué signo esperamos para los coeficientes? 
Beta 1: negativo 
Beta 2: seguramente negativo, ya que andar en metro reporta menor utilidad. Puede depender de la persona, lo que es uno de los problemas de 
este modelo (asume que todos somos iguales y que todos tienen la misma preferencia) 
El modelo supone homogeneidad de preferencias, para el mismo tiempo se prefiere el metro en todas las personas, lo que no es cierto. 
 
b) ¿Cómo se sacaron los datos? ¿Qué datos recolecté? 
Tiempo de demora en auto y metro. Cuál fue realmente la elección. 
3 variables: 
1. Si usan el metro o auto en términos genéricos (si lo uso ayer, o hace un mes): variable dependiente 
2. Cuanto tiempo creen o se demoraron en el viaje. 
En la tarea los datos fueron obtenidos de Nilsen, de acuerdo con las transacciones (lo que efectivamente compró y pagó) y el caso de transportes 
es con una encuesta, es con datos perceptibles. La constante de marca se incluye automáticamente con los datos. 
 
c) ¿Qué otras variables podrían ser relevantes? 
eqengenera
aseara.ua
ns.comopo poiespo
enanos.be conveniente raro
amas
esmejor asigno poip.noroonvan.am esimiarennuera todos
constante
era
probabiiiaaaaeewoioriapari.ir
a asumida
a mi
no aan
Variables que se podrían incluir y ser relevantes: costo, comodidad, seguridad, hora (quizás modelo es distinto dependiendo a la hora del día que 
debo viajar), estrés, tráfico, etc. 
Lo que gano agregando más variables: represento mejor, el épsilon es más chico, modelo explica mejor, mayor precisión, mayor R^2. 
2 indicadores de calidad del modelo (de bondad de ajuste) 
1. R^2 
2. Cuantos individuos están correctamente clasificados: mayor cantidad de elecciones correctas (ya que el modelo predice una elección, 
asigna probabilidades a las dos elecciones): si modelo predice mejor podré usarlo en otras circunstancias (si vamos a instalar una estación 
de metro y lo que significa para las personas que viven cerca de esta estación: si se demorarán menos tiempo, será mejor, etc.)-> si el 
modelo explica mejor podemos predecir con el modelo anterior. 
Se compara la elección con la probabilidad (se calcula con el comando predict y se pone el nombre, lo que da la columna con la 
probabilidad) 
 
Excel: tenemos cada individuo y cada uno tiene dos alternativas. En total tenemos 21 individuos, siempre con las dos alternativas metro y auto. 
Luego tenemos variable dependiente (la variable y de una regresión): que va a ser 0 y 1. Tenemos los tiempos y las constantes de marca. 
Lo primero que hay que hacer es calcular los coeficientes y el profesor inicialmente los ha fijado en 0,1 (en stata es automático) y si tengo los 
coeficientes puedo calcular la U*. Y teniendo U* puedo calcular la probabilidad y con esta puedo calcular la función verosimilitud (maximizar la 
probabilidad de lo observado). Por ejemplo, si individuo 1 eligió auto y vamos a tratar de maximizar la probabilidad-> cuando no fue elegido le 
pongo 0 y si fue elegido maximizo el log de la probabilidad. Arriba tiene la suma de todas las probabilidades. 
Como se eligen los coeficientes: conceptualmente de manera que las probabilidades de lo que cada individuo eligió sea lo más grande posible. En 
la práctica se suman el log de todas las probabilidades de lo que el individuo eligió y se hace un solver. 
 
Proposición: llevar el Excel al stata y ver si nos dan los mismos coeficientes. 
 
El consumidor 2 es extraño: se demora muy poco en metro y mucho en auto, y eligió el auto. Como resultado de la maximización de la probabilidad 
no es tan alta. 
 
¿Cómo calcula el LL0? Modelo que solo tiene las constantes de marca (solo tiene la variable metro): saco de clogit el tiempo, lo que está haciendo 
que obligue al coeficiente de tiempo igual a 0. Este será -14,5 y es más chico que LL. ¿Está bien esto? Si está bien. Porque si agrego variables el 
modelo mejora, explica más. 
Con los LL puedo calcular el R^2. 
*Los LL siempre son negativos (es log de una probabilidad) y en valor absoluto no significan nada. 
LL máximo absoluto sería 0, cuando las probabilidades son igual a 1. Log de 1 es 0 y la suma sería 0. 
 
d) Calcule la probabilidad de elegir el auto (eje vertical) en función del tiempo de transporte (en el eje horizontal). Si tiempo de 
transporte es 50 (75) minutos ¿Cómo sería la función si el coeficiente del tiempo fuese mayor en valor absoluto? 
Nos dan las utilidades, con las que calculamos las probabilidades. Esta función tiene forma de s, no es lineal. 
Si en lugar de 0,05 fuese 0,1 la pendiente de la curva seríamayor. A medida que el coeficiente es mayor la pendiente crece (es con pendiente 
negativa, ya que el coeficiente es negativo). 
 
e) ¿Cuántos minutos más tiene que demorar el auto para que un consumidor esté indiferente? 
Suponemos que individuos prefieren auto. Para que quede indiferente hay que igualar las utilidades 
-0,05(T + x) = -0,24 0,05T 
Podemos despejar y calcular el x=4,8 minutos. Tiene que haber un x, ya que el metro no es lo preferido, si no que en si el auto. 
*Dos formas de calcular lo que las personas eligen, mirando lo que efectivamente eligieron o mirando la probabilidad. Puede ser que el modelo 
este mal y me lleve a una proporción distinta o por desviación debido al épsilon y que me lleve a utilidades distintas. 
 
f) Si los tiempos de transporte son iguales, ¿Qué proporción de las personas prefiere el auto? 
Si los tiempos de transporte son iguales la Ua = -0,05Ta y Um= -0,24 0,05Tm. Si igualo estas dos utilidades con T, los tiempos se van a cancelar. 
Pa = exp (Ua) / (exp (Ua) + exp (Um)) 
Pa = exp (0) / (exp (0) + exp (-0,24)) 
Pa = 56% 
 
g) Si se introduce un sistema de buses que captura el 10% del mercado, ¿quién pierde? 
La Hipótesis de independencia de alternativas irrelevantes dice que, si viene un nuevo oferente, que captura el 10% del mercado, el auto y el metro 
se van a quedar con el 90%. ¿Qué parte va a captar el auto y el metro del 90%? Se lo va a quitar en la misma proporción que tienen hoy. 
Pa = 55% Pm = 45% 
Nueva Pa = 0,55 * 90% = 0,5 Pm = 0,45 * 90% = 0,4 y Pb = 0,1 
 
El auto y metro van a seguir en la misma proporción que antes (osea Pa/Pm va a ser lo mismo) 
¿Es un buen supuesto la IAI? No necesariamente, ya que el bus se podría parecer más al metro y uno esperaría que la proporción de autos no 
cambie tanto, debiera cambiar más el metro. El que va a sufrir más con el 10% debería ser el metro, esto esperaría uno a priopi, por lo que la Pm 
sería más cercano a 35% y Pa se mantendría parecida. 
Esto sirve para dimensionar cuantas personas se van a ir en el metro, capacidad que necesito en el metro y buses. Es decir, la frecuencia con que 
deben salir los buses y metro, etc. 
 
Si borro una marca voy a tener ciertos sujetos que no van a tener elección, por lo que hay que tener cuidado y también ponerle una elección. 
 
Caso automóviles 
 
3 marcas de automóviles en USA y todas las otras juntas. Quiero mirar que es lo que ocurre con esto. 
La matriz p: corresponde a la matriz de transición, como se cambian los consumidores de una marca a otra. Por filas suman 100. 
Cuando trabajamos con este modelo los supuestos hechos son: 
1. P es constante: es el producto de lealtades de marca, campañas de marca, acciones de marketing, estrategia de marketing (se resumen 
en lealtad (retener) y atraer). 
Este modelo sirve para hacer predicciones futuras, para predecir la participación de mercado futuras condicional a que p es constante y por lo 
tanto todas las cosas permanecen como ahora. 
En este caso en particular con este modelo gana participación de mercado 
Marca con mayor lealtad es 
Marca que más pierde son Ford y Krisler 
Arriba a la derecha están los indicadores de lealtad y atracción: 
- Critique la estrategia de Ford: tiene mucha lealtad, pero está perdiendo atracción. El énfasis lo ha puesto en la lealtad y no se ha preocupado de 
atraer nuevos clientes. El resultado de esto lleva a que pierda participación de mercado, por lo tanto, su estrategia no es correcta. Una estrategia 
tan concentrada en lealtad no es correcta. ¿Por qué una estrategia tan basada en la lealtad limita el crecimiento y no es correcta? Porque no atrae 
nuevos clientes y las lealtades no son tan altas (entre 60 y 70%), por lo que muchos clientes se van a fugar, no permanecen con los mismos clientes 
siempre y las estrategias de las otras compañías hacen que los clientes se vayan a otras marcas. 
A través de estos pequeños indicadores podemos ver las estrategias. 
- La estrategia de Krisler ha sido un desastre. ¿Va a seguir perdiendo participación (va en 9,5%) de mercado? No, porque esto converge, por lo 
tanto, va a llegar a un límite (9,5%) y de ahí no se va a mover. Para que siga cayendo habría que cambiar algo de la matriz p. 
La lealtad se calcula con la diagonal de la matriz: porcentaje de consumidores de una marca que vuelven a comprar la misma marca. 
La atracción es el porcentaje de consumidores que compraba otra marca y que ahora va a comprar la mía. 
¿Cuántos compraban Ford el primer año? 24,4% -> el 10% de los que compraban Fo

Más contenidos de este tema