Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Análisis Multivariante Curso 2022-23 / 2º semestre Página 1 de 6 Nombre y apellidos del estudiante Prueba de evaluación continua 2. ANÁLISIS BIVARIANTE Criterios de evaluación Las preguntas y los problemas tienen que estar desarrollados y razonados. No se considerará correcta ninguna respuesta no argumentada. Cada pregunta vale 1/3 del total de puntos. Formato y fecha de entrega. Las pruebas de evaluación continuada se tienen que entregar en el buzón específico de Entrega de actividades que se encuentra en el apartado Evaluación del aula en un único fichero en formato WORD o PDF. El último día para entregar esta actividad es el próximo 11 de abril. Enunciado Tras el análisis desarrollado en la PEC1, en el que hemos estudiado diferentes aspectos del perfil de los clientes del centro comercial, básicamente a partir de la edad, y en el que hemos visto que una mayoría de clientes podemos considerar que no son jóvenes (tienen más de 28 años), ahora queremos profundizar un poco más con el grado de satisfacción del cliente (ver el apartado 4 del caso práctico “El triángulo de las Bermudas”). En el caso práctico se analiza el grado de satisfacción general (variable SATISF_GEN) a partir de la calidad percibida en diferentes aspectos específicos del centro, como por ejemplo el nivel de precios, o la calidad del aparcamiento, entre otros. En esta PEC estaremos interesados en hacer este análisis desde otro punto de vista. Siguiendo con las conclusiones de la PEC1, el gerente del centro comercial quería analizar inicialmente las relaciones (de causalidad o no) entre la edad y el sexo, con la satisfacción general. A partir de los datos que hay en el fichero "Datos_CasoPractico1", en cualquiera de los formatos en el que os lo facilitamos, que contiene una submuestra (264 observaciones) de los datos en los que se basa el caso práctico de "El triángulo de las Bermudas", se pide que contestéis, de forma razonada las siguientes cuestiones: PEC2. ANÁLISIS BIVARIANTE Página 2 de 6 SOLUCION Pregunta 1: Para ayudar al gerente a ver si hay relación entre la edad y el sexo, con la satisfacción general, se pide: 1.1. Realizad un diagrama de dispersión entre las variables edad (EDAD) y satisfacción general (SATISF_GEN). A partir de este diagrama, ¿se puede concluir que existe alguna relación entre las variables? ¿las personas con más edad están más o menos satisfechas que las de menos edad? Razona d la respuesta. Nota: Para hacer el diagrama debéis ir a la opción: Gráficas > Diagrama de dispersión… Diagrama de dispersion De acuerdo a este digrama de dispersion no podemos establecer una linea de tendencia entre la variable EDAD y SATISF_GEN. De esta forma no podemos decir claramente si los clientes mas jovenes o viejos tiene mayor o menor satisfaccion. 1.2 A pesar de las evidencias gráficas que hemos podido observar en el apartado anterior, queremos reforzar las conclusiones a partir de un análisis de correlaciones entre las dos variables. Realizad este análisis y comentad el resultado. Nota: En el comentario de resultados debéis decir si hay o no correlación, si es significativamente distinta de cero, si es positiva o negativa, y si hay indicios de una posib le relación lineal. Con R-Commander tenéis que hacer: Estadísticos > Resúmenes > Matriz de correlaciones y marcar la opción “valores p dos a dos”. 20 30 40 50 60 2 4 6 8 1 0 EDAD S A T IS F _ G E N PEC2. ANÁLISIS BIVARIANTE Página 3 de 6 Podemos observar que el p – valor es 0,0016 < 0,05 por lo tanto rechazamos la hipótesis nula y si existe correlación. Además, podemos afirmar que la correlación es positiva, al ser positivo el coeficiente de correlación, lo que nos indica que, a mayor edad, mayor será la satisfacción. Sin embargo, esta correlación es bastante baja o muy débil debido a que el coeficiente de correlación es de 0,194 1.3 Para ver si hay relación entre el sexo y el grado de satisfacción, ¿podemos desarrollar el análisis que hemos hecho en el caso de la edad? ¿Por qué? En caso de que no se pueda hacer lo mismo, proponed una alternativa, haced los cálculos correspondientes, y comentad los resultados. Nota: Para responder esta cuestión en la base de datos, la variab le sexo (SEXO) debe convertirse de Numérica Factor (SEXOR) considerando que el valor 1 es Hombre y el valor 2 es Mujer. Considerad un nivel de significación de 0,05 y asumid igualdad de varianzas entre los grupos. La variable Sexo al ser una variable cualitativa nominal no puede ser utilizada para realizar una correlación, se debe utilizar otro tipo de análisis o prueba estadística. Para este caso se debe utilizar una Prueba de t – student de comparación de medias en muestras independientes. Dado que la variable sexo determina dos grupos independientes. A continuación, se presentan los resultados de la prueba. Tenemos que el p – valor es de 0,8399 > 0,05 por lo tanto no se puede rechazar la hipótesis nula que para esta prueba es que no existe diferencia significativa entre las medias. En pocas palabras no podemos decir que el sexo y la satisfacción están relacionadas, dado que las medias de los grupos son estadísticamente iguales. 1.4 Escoged una herramienta gráfica que permita explorar si la relación entre las variables edad y satisfacción general es diferente entre hombres y mujeres. ¿A qué conclusión llegáis? Utilizando la opción Gráficas > Gráfica XY, podemos hacer un gráfico de la relación entre la edad (X) y la satisfacción general (Y) utilizando como grupo de diferenciación el sexo. Se puede observar que no existe diferencias significativas en el comportamiento entre la satisfacción y la edad, para los hombres o mujeres. PEC2. ANÁLISIS BIVARIANTE Página 4 de 6 Pregunta 2: El gerente del centro comercial, preocupado por la competencia con los otros dos centros comerciales que configuran, con el suyo, "El Triángulo de las Bermudas", quiere analizar los clientes de fuera del barrio. Es decir, quiere entender mejor los potenciales clientes de la competencia, que deciden desplazarse a su centro comercial. Para ello, y teniendo en cuenta que la utilización del parking es la clave para considerar si un cliente es o no del barrio, se pide: 2.1 Realizad un análisis de regresión simple entre el nivel de satisfacción general (SATISF_GEN) y el nivel de calidad percibida del parking (P34_5). ¿A qué conclusión se llega? Comentad los resultados. Nota: Comentad la significación individual de parámetros, la significación global del modelo, el nivel de ajuste, y el signo del coeficiente asociado a la variab le explicativa. Significación individual de los parámetros: Para la variable independiente P34_5 (“nivel de calidad percibida del parking”), el p – valor es significativo (1.15e-14<0,05) de forma similar el p – valor para el termino independiente o intercepto es significativo (2e-16<0,05). Ambos son estadisticamente distintos de cero para un nivel de significacion del 5% Significación conjunta de los parámetros: el estadistico F tiene un p – valor asociado de 1.15e-14, por lo tanto el modelo es estadisticamente significativo con un 95% de confianza. Nivel de ajuste: el valor del coeficiente de determinación R2 es bajo, con este modelo de regresion lineal simple, la variación del nivel satisfacción general es explicada por la calidad percibida del parking en solo un 20,67%. Signos esperados y valores estimados de los parámetros: el signo del parámetro que acompaña a la variable independiente ("nivel de calidad percibida del parking") es positivo, lo cual indica una relacion directa entre nivel de calidad percibida del parking conllevará un aumento del nivel de satisfacción general. 2.2 ¿Creéis que el análisis anterior se ha desarrollado correctamente? ¿Creéisque la muestra, que incluye todos los casos, es la apropiada? ¿Por qué? En el analisis anterior existe un error en la cantidad de individuos o muestra que se consideran, al utilizar la variable nivel de calidad percibida del parking o P34_5 sin restriccion se estan tomando tanto los que usan o no el servicio, por consiguiente no solo se analisan los de fuera del barrio sino tambien los del barrio. Lo correcto debe ser solo utilizar los clientes que usen el parking es decir P34_5 = 1 para poder analisar su relacion con la satisfaccion general. En conclusion, los resultados anteriores no reflejan la realidad de lo que el gerente se desea analizar, la muestra es incorrecta. PEC2. ANÁLISIS BIVARIANTE Página 5 de 6 2.3 Repetid el análisis del apartado 2.1 pero ahora considerando sólo los usuarios del parking. ¿A qué conclusión se llega? ¿Ha mejorado la estimación? Nota: Para hacer esto, debéis tener presente que se debe seleccionar una submuestra, con sólo aquellos casos en que se ha usado el parking. Es decir, con aquellos casos en que P14_M23 = 1. Indicad la expresión de selección (P14_M23R=="1" o P14_M23==1) en la misma ventana del modelo de regresión lineal. Al igual que en el modelo anterior los parámetros siguen siendo significativos. Sin embargo, el nivel del ajuste es más bajo que en el caso anterior dado que el coeficiente de determinación R2 es ahora de 19,74% .En este caso tenemos la muestra correcta para el analisis que se desea realizar, pero no ha mejorado la estimacion dado que la bondad de ajuste del modelo disminuyo,asi como el valor de coeficiente para la variable P34_5, lo que nos indica que esta variable por si sola no es sufuciente para explicar de forma correcta la satisfaccion general. Pregunta 3: A partir de los resultados obtenidos en las preguntas anteriores, el gerente estaba un poco "despistado". No parecía muy apropiado analizar el nivel de satisfacción a partir de la edad, y además para los clientes de fuera del barrio no parecía muy relevante la percepción de la calidad del parking a la hora de entender mejor su nivel de satisfacción. Quizá lo que estaba pasando era que no se podía considerar una buena aproximación la utilización del parking con el hecho de ser o no del barrio. Para tratar de averiguarlo, quiso relacionar la utilización del parking con el sexo, y también con el día de visita al centro comercial: ¿hombres y mujeres usan igualmente el parking, aunque lo hagan el fin de semana o en día laborable? ¿los fines de semana se usa más el parking, independientemente de que seas del barrio o no? Para ayudar al gerente a responder a estas cuestiones, se pide responder a los siguientes apartados: 3.1 Realizad una tabla de contingencia entre la variable sexo como factor (SEXOR) y la variable utilización del parking como factor (P14_M23R). ¿A qué conclusión se llega? Razonad los resultados. PEC2. ANÁLISIS BIVARIANTE Página 6 de 6 En la tabla de contingencia tenemos que para el estadístico Chi-cuadrado el p – valor es de 0,09461 > 0,05 por lo tanto no podemos rechazar la hipoitesis nula de la prueba que en este caso seria que el sexo y la utilizacion del parking son independientes. Por lo tanto no podemos asegurar estadisticamente que el sexo y la utilizacion del parking este relacionados. 3.2 Realizad una tabla de contingencia entre el hecho que la visita se haga el fin de semana o en día laborable, y la variable utilización del parking como factor (P14_M23R). ¿A qué conclusión llegáis? ¿Creéis que la utilización del parking tiene más a ver con el sexo o con el día de visita al centro comercial? Razonad las respuestas. Nota: Para responder esta pregunta tenéis que crear una nueva variable (FINDER) a partir de la variable DIA_ENTREV (1=Lunes, 2=Jueves, 3=Viernes, 4=Sábado) como factor. Al crear la variab le FINDER hacedlo de forma que tome dos valores (0 y 1) en función de si el día es laborable (valor 0) o si es de fin de semana (valor 1). En la tabla de contingencia tenemos que el p – valor del estadístico Chi-cuadrado es 0,6226 > 0,05 por lo tanto podemos afirmar que existe independencia entre las dos variables. Lo cual significa que no podemos afirmar estadisticamente que el dia de la semana influya en usar mas o menos el parking. 3.3 Realizad una tabla de contingencia entre la variable DIA_ENTREV como factor (FINDER) y la variable SEXO como factor (SEXOR). ¿A qué conclusión llegáis? Razonad vuestras respuestas. En la tabla de contingencia tenemos que el p – valor del estadístico Chi-cuadrado es 0,455 > 0,05 por lo tanto podemos al igual que en la prueba anterior, afirmar que existe independencia entre las dos variables . Paras este caso no existe relacion entre el sexo y los dias de visita al centro comercial. 3.4 ¿Por qué no tiene sentido hacer un análisis de correlaciones, o una regresión lineal, entre las variables consideradas en esta pregunta? Razonad la respuesta. Las variables consideradas en esta pregunta son cualitativas dicotómicas (SEXOR, P14_M23R) o cualitativas nominales (FINDER) el coeficiente de correlación lineal de Pearson requiere que la variable independiente sea cuantitativa y la explicada como mínimo cualitativa ordinal, condiciones que no se cumplen en las variables estudiadas.
Compartir