Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Análisis Multivariante Curso 2022-23 / 2º semestre Página 1 de 5 Nombre y apellidos del estudiante Prueba de evaluación continua 1. ANÁLISIS UNIVARIANTE Criterios de evaluación Las preguntas y los problemas tienen que estar desarrollados y razonados. No se considerará correcta ninguna respuesta no argumentada. Cada pregunta vale 2 puntos. Formato y fecha de entrega Las pruebas de evaluación continuada se tienen que entregar en el buzón específico de Entrega de actividades que se encuentra en el apartado Evaluación del aula en un único fichero en formato WORD o PDF. El último día para entregar esta actividad es el próximo 22 de marzo. Enunciado En el estudio de mercado de "El triángulo de las Bermudas", el gerente del centro comercial Barcelona Glorias estaba interesado en conocer un poco mejor a sus clientes para poder derivar algunas decisiones estratégicas de futuro. En el apartado 3 del caso práctico se analiza el comportamiento de compra a partir de una muestra representativa de 531 visitantes. En esta primera PEC nos queremos centrar en la variable de Satisfacción de los clientes poniendo énfasis en la satisfacción con el parking. A partir de los datos del archivo "Datos_CasoPractico1", en cualquiera de los formatos en el que os lo facilitamos, que contiene una submuestra (264 observaciones) de los datos en los que se basa el caso práctico de "El triángulo de las Bermudas", se pide que contestéis de forma razonada las siguientes cuestiones: Pregunta 1: Realizad un histograma de la variable Satisfacción General (SATISF_GEN) y de la variable Edad del entrevistado (EDAD), y el correspondiente análisis descriptivo para ambas variables. Comentad los principales resultados obtenidos en relación a las medidas de centro, de dispersión y de forma de la distribución. Solución: En la variable Satisfacción General (SATISF_GEN), la media es 7,33 que es próxima a la mediana de 7 por lo que podemos afirmar que no habrá valores extremos. El coeficiente de variación de 0,169, al ser inferior a 0,5; tenemos una media que es representativa de la distribución. La distribución es asimétrica hacia la izquierda, lo evidenciamos en el coeficiente de skewness de -0,636 y en el histograma. Las puntuaciones bajas tienen inferior frecuencia que las puntuaciones altas. En la variable EDAD, tenemos una media 35,77 que también se aproxima a la mediana de 32. El coeficiente de variación es de0,342, al ser inferior a 0,5; tenemos una media que es representativa de la distribución, La distribución es asimétrica hacia la derecha, lo evidenciamos en el coeficiente de skewness de 0,500 y en el histograma. Las puntuaciones bajas tienen mayor frecuencia que las puntuaciones altas http://materials.cv.uoc.edu/continguts/XW08_84003_00012/web/main/m1/v1.html PEC1. ANÁLISIS UNIVARIANTE Pàgina 2 de 5 Histogramas de las variables EDAD y SATISF_GEN Pregunta 2: El gerente del centro comercial quiere saber si su cliente interno es eminentemente joven o mayor. Esta importante información podría hacer reorientar su estrategia a la hora de abrir nuevos negocios. En este sentido, se plantea contrastar la siguiente hipótesis: el cliente tipo tiene una edad media de 30 años, o alternativamente, que esta media es mayor de 30 años. En esta pregunta se pide que ayudéis al gerente a contrastar esta hipótesis, con un nivel de significación de 0,05. ¿A qué conclusión llegáis? Razonad la repuesta. Nota: Plantead las hipótesis nula y alternativa, buscad el estadístico de contraste y su valor-p, y solucionad el contraste. Solución: Planteamos el siguiente sistema de hipótesis: H0: El promedio de edad para el cliente tipo es igual a los 30 años H1: El promedio de edad para el cliente tipo es superior a los 30 años Se observa que el valor – p es 1.815e-13 obviamente inferior a 0,05. Podemos rechazar la hipótesis nula a favor de la alternativa. En consecuencia; “El promedio de edad para el cliente tipo es superior a los 30 años ” con un 95% de confianza EDAD fr e q u e n c y 20 30 40 50 60 0 1 0 2 0 3 0 4 0 SATISF_GEN fr e q u e n c y 2 4 6 8 10 0 2 0 4 0 6 0 8 0 1 0 0 PEC1. ANÁLISIS UNIVARIANTE Pàgina 3 de 5 Pregunta 3: Con el objetivo de entender mejor a su cliente, y en concreto la edad de este cliente, se plantea analizar si puede haber o no diferencias entre sexos en lo referente a la edad. Quiere responder la siguiente cuestión: ¿las mujeres que visitan el centro comercial tienen la misma edad (mediana) que los hombres? En esta pregunta se pide que respondáis a esta cuestión a partir de la realización de un diagrama de caja de la variable edad (EDAD) para los hombres y otro para las mujeres. Comentad el resultado obtenido. Nota: Para responder a esta cuestión debéis tener presente que, en la base de datos, la variab le sexo (SEXO) se tiene que convertir de Numérica a Factor (SEXOR). Considerad que el valor 1 es Hombre y el valor 2 es Mujer. Solución: La mediana de la edad para las mujeres de 35 es superior que para los hombres de 32. Sin embargo, la media para los hombres de 36,05 es ligeramente superior que para las mujeres de 35,56. Adicionalmente, las edades de las mujeres están ligeramente más cercanas que las edades de los hombres, dado que los cuartiles 1 y 3 se encuentran más cercanos en el grupo de las mujeres que en el grupo de los hombres. Puede considerarse que existen algunas diferencias entre los hombres y mujeres en función a la edad. Hombre Mujer 2 0 3 0 4 0 5 0 6 0 SEXO_F E D A D PEC1. ANÁLISIS UNIVARIANTE Pàgina 4 de 5 Pregunta 4: Para complementar el resultado de la pregunta anterior se plantea ahora analizar si puede haber o no diferencias entre sexos en lo que respecta a la edad, a partir del contraste de hipótesis correspondiente (asumid igualdad de varianzas entre los grupos). Comentad el resultado obtenido. Nota: Para responder a esta cuestión debéis tener presente que se debe dividir la muestra en dos, una para los hombres y otra para las mujeres. En la base de datos, la variab le sexo (SEXO) se tiene que convertir de Numérica a Factor (SEXOR). Considerad que el valor 1 es Hombre y el valor 2 es Mujer. Considerad un nivel de significación de 0,05. Solución: Planteamos el siguiente sistema de hipótesis: H0: El promedio de edad para los hombres y mujeres es igual H1: El promedio de edad para los hombres y mujeres es diferente Se observa que el p-value = 0.7489 es superior a 0,05 por lo tanto no podemos rechazar la hipótesis nula, por lo tanto “El promedio de edad para los hombres y mujeres es igual” con un 95% de confianza PEC1. ANÁLISIS UNIVARIANTE Pàgina 5 de 5 Pregunta 5: Para redondear el análisis el gerente se plantea contrastar si hay una mayoría de clientes jóvenes. Definimos la variable JOVENES que tomaría el valor 1 si el entrevistado tiene una edad inferior o igual a 28 años, y el valor 0 para los mayores de 28 años. Se pide que resolváis el siguiente contraste de hipótesis: H0: el porcentaje de jóvenes es del 50% H1: el porcentaje de jóvenes es mayor que el 50% Comentad los resultados. Nota: Observad que se debe hacer un contraste de hipótesis de proporciones, unilateral (Test b inomial exacto). Se tiene que crear la variab le JOVENES como factor y se deben reordenar sus valores. Considerad un nivel de significación de 0,05. Solución: Dado que el valor P del contraste es 1, obviamente mayor que el nivel de significación, no podemos rechazar la hipótesis nula, y por lo tanto podemos afirmar que el porcentaje de jóvenes es inferior o igual al 50%. En consecuencia, el gerente tiene indicios que la mayoría de sus clientes tienen más de 28 años.
Compartir