Logo Studenta

Estadistica_Analisisbivariante1

¡Estudia con miles de materiales!

Vista previa del material en texto

Análisis Multivariante 
Curso 2022-23 / 2º semestre 
 
Página 1 de 6 
 
Nombre y apellidos del estudiante 
 
 
Prueba de evaluación continua 2. ANÁLISIS BIVARIANTE 
 
Criterios de evaluación 
 
Las preguntas y los problemas tienen que estar desarrollados y razonados. No se considerará correcta ninguna 
respuesta no argumentada. Cada pregunta vale 1/3 del total de puntos. 
 
Formato y fecha de entrega. 
Las pruebas de evaluación continuada se tienen que entregar en el buzón específico de Entrega de actividades 
que se encuentra en el apartado Evaluación del aula en un único fichero en formato WORD o PDF. El último 
día para entregar esta actividad es el próximo 11 de abril. 
 
Enunciado 
 
Tras el análisis desarrollado en la PEC1, en el que hemos estudiado diferentes aspectos del perfil de los clientes 
del centro comercial, básicamente a partir de la edad, y en el que hemos visto que una mayoría de clientes 
podemos considerar que no son jóvenes (tienen más de 28 años), ahora queremos profundizar un poco más 
con el grado de satisfacción del cliente (ver el apartado 4 del caso práctico “El triángulo de las Bermudas”). 
 
En el caso práctico se analiza el grado de satisfacción general (variable SATISF_GEN) a partir de la calidad 
percibida en diferentes aspectos específicos del centro, como por ejemplo el nivel de precios, o la calidad del 
aparcamiento, entre otros. En esta PEC estaremos interesados en hacer este análisis desde otro punto de vista. 
Siguiendo con las conclusiones de la PEC1, el gerente del centro comercial quería analizar inicialmente las 
relaciones (de causalidad o no) entre la edad y el sexo, con la satisfacción general. 
 
A partir de los datos que hay en el fichero "Datos_CasoPractico1", en cualquiera de los formatos en el que 
os lo facilitamos, que contiene una submuestra (264 observaciones) de los datos en los que se basa el caso 
práctico de "El triángulo de las Bermudas", se pide que contestéis, de forma razonada las siguientes cuestiones: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PEC2. ANÁLISIS BIVARIANTE 
Página 2 de 6 
 
 
SOLUCION 
 
Pregunta 1: 
Para ayudar al gerente a ver si hay relación entre la edad y el sexo, con la satisfacción general, se pide: 
 
1.1. Realizad un diagrama de dispersión entre las variables edad (EDAD) y satisfacción general 
(SATISF_GEN). A partir de este diagrama, ¿se puede concluir que existe alguna relación entre las 
variables? ¿las personas con más edad están más o menos satisfechas que las de menos edad? Razona d 
la respuesta. 
Nota: Para hacer el diagrama debéis ir a la opción: Gráficas > Diagrama de dispersión… 
 
 
 
Diagrama de dispersion 
 
De acuerdo a este digrama de dispersion no podemos establecer una linea de tendencia entre la variable EDAD y 
SATISF_GEN. De esta forma no podemos decir claramente si los clientes mas jovenes o viejos tiene mayor o menor 
satisfaccion. 
 
 1.2 A pesar de las evidencias gráficas que hemos podido observar en el apartado anterior, queremos reforzar 
las conclusiones a partir de un análisis de correlaciones entre las dos variables. Realizad este análisis y 
comentad el resultado. 
Nota: En el comentario de resultados debéis decir si hay o no correlación, si es significativamente distinta de cero, si 
es positiva o negativa, y si hay indicios de una posib le relación lineal. Con R-Commander tenéis que hacer: 
Estadísticos > Resúmenes > Matriz de correlaciones y marcar la opción “valores p dos a dos”. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
20 30 40 50 60
2
4
6
8
1
0
EDAD
S
A
T
IS
F
_
G
E
N
PEC2. ANÁLISIS BIVARIANTE 
Página 3 de 6 
 
Podemos observar que el p – valor es 0,0016 < 0,05 por lo tanto rechazamos la hipótesis nula y si existe correlación. 
Además, podemos afirmar que la correlación es positiva, al ser positivo el coeficiente de correlación, lo que nos indica 
que, a mayor edad, mayor será la satisfacción. Sin embargo, esta correlación es bastante baja o muy débil debido a 
que el coeficiente de correlación es de 0,194 
 
 
1.3 Para ver si hay relación entre el sexo y el grado de satisfacción, ¿podemos desarrollar el análisis que hemos 
hecho en el caso de la edad? ¿Por qué? En caso de que no se pueda hacer lo mismo, proponed una 
alternativa, haced los cálculos correspondientes, y comentad los resultados. 
Nota: Para responder esta cuestión en la base de datos, la variab le sexo (SEXO) debe convertirse de Numérica Factor 
(SEXOR) considerando que el valor 1 es Hombre y el valor 2 es Mujer. Considerad un nivel de significación de 0,05 y 
asumid igualdad de varianzas entre los grupos. 
 
La variable Sexo al ser una variable cualitativa nominal no puede ser utilizada para realizar una 
correlación, se debe utilizar otro tipo de análisis o prueba estadística. Para este caso se debe utilizar una 
Prueba de t – student de comparación de medias en muestras independientes. Dado que la variable 
sexo determina dos grupos independientes. A continuación, se presentan los resultados de la prueba. 
 
Tenemos que el p – valor es de 0,8399 > 0,05 por lo tanto no se puede rechazar la hipótesis nula que para 
esta prueba es que no existe diferencia significativa entre las medias. En pocas palabras no podemos decir 
que el sexo y la satisfacción están relacionadas, dado que las medias de los grupos son estadísticamente 
iguales. 
 
1.4 Escoged una herramienta gráfica que permita explorar si la relación entre las variables edad y satisfacción 
general es diferente entre hombres y mujeres. ¿A qué conclusión llegáis? 
Utilizando la opción Gráficas > Gráfica XY, podemos hacer un gráfico de la relación entre la edad (X) y la 
satisfacción general (Y) utilizando como grupo de diferenciación el sexo. Se puede observar que no existe 
diferencias significativas en el comportamiento entre la satisfacción y la edad, para los hombres o mujeres. 
 
 
 
 
PEC2. ANÁLISIS BIVARIANTE 
Página 4 de 6 
 
Pregunta 2: 
El gerente del centro comercial, preocupado por la competencia con los otros dos centros comerciales que 
configuran, con el suyo, "El Triángulo de las Bermudas", quiere analizar los clientes de fuera del barrio. Es 
decir, quiere entender mejor los potenciales clientes de la competencia, que deciden desplazarse a su centro 
comercial. 
 
Para ello, y teniendo en cuenta que la utilización del parking es la clave para considerar si un cliente es o no 
del barrio, se pide: 
 
2.1 Realizad un análisis de regresión simple entre el nivel de satisfacción general (SATISF_GEN) y el nivel de 
calidad percibida del parking (P34_5). ¿A qué conclusión se llega? Comentad los resultados. 
Nota: Comentad la significación individual de parámetros, la significación global del modelo, el nivel de ajuste, y el 
signo del coeficiente asociado a la variab le explicativa. 
 
 
 
Significación individual de los parámetros: Para la variable independiente P34_5 (“nivel de calidad 
percibida del parking”), el p – valor es significativo (1.15e-14<0,05) de forma similar el p – valor para el 
termino independiente o intercepto es significativo (2e-16<0,05). Ambos son estadisticamente distintos de 
cero para un nivel de significacion del 5% 
Significación conjunta de los parámetros: el estadistico F tiene un p – valor asociado de 1.15e-14, por 
lo tanto el modelo es estadisticamente significativo con un 95% de confianza. 
Nivel de ajuste: el valor del coeficiente de determinación R2 es bajo, con este modelo de regresion lineal 
simple, la variación del nivel satisfacción general es explicada por la calidad percibida del parking en solo 
un 20,67%. 
Signos esperados y valores estimados de los parámetros: el signo del parámetro que acompaña a la 
variable independiente ("nivel de calidad percibida del parking") es positivo, lo cual indica una relacion 
directa entre nivel de calidad percibida del parking conllevará un aumento del nivel de satisfacción general. 
 
 
2.2 ¿Creéis que el análisis anterior se ha desarrollado correctamente? ¿Creéisque la muestra, que incluye 
todos los casos, es la apropiada? ¿Por qué? 
 
 
En el analisis anterior existe un error en la cantidad de individuos o muestra que se consideran, al utilizar 
la variable nivel de calidad percibida del parking o P34_5 sin restriccion se estan tomando tanto los que 
usan o no el servicio, por consiguiente no solo se analisan los de fuera del barrio sino tambien los del barrio. 
Lo correcto debe ser solo utilizar los clientes que usen el parking es decir P34_5 = 1 para poder analisar su 
relacion con la satisfaccion general. 
En conclusion, los resultados anteriores no reflejan la realidad de lo que el gerente se desea analizar, la 
muestra es incorrecta. 
 
 
 
 
PEC2. ANÁLISIS BIVARIANTE 
Página 5 de 6 
 
 
 
2.3 Repetid el análisis del apartado 2.1 pero ahora considerando sólo los usuarios del parking. ¿A qué 
conclusión se llega? ¿Ha mejorado la estimación? 
Nota: Para hacer esto, debéis tener presente que se debe seleccionar una submuestra, con sólo aquellos casos en 
que se ha usado el parking. Es decir, con aquellos casos en que P14_M23 = 1. Indicad la expresión de selección 
(P14_M23R=="1" o P14_M23==1) en la misma ventana del modelo de regresión lineal. 
 
Al igual que en el modelo anterior los parámetros siguen siendo significativos. Sin embargo, el nivel del 
ajuste es más bajo que en el caso anterior dado que el coeficiente de determinación R2 es ahora de 19,74% 
 
.En este caso tenemos la muestra correcta para el analisis que se desea realizar, pero no ha mejorado la 
estimacion dado que la bondad de ajuste del modelo disminuyo,asi como el valor de coeficiente para la 
variable P34_5, lo que nos indica que esta variable por si sola no es sufuciente para explicar de forma 
correcta la satisfaccion general. 
 
Pregunta 3: 
A partir de los resultados obtenidos en las preguntas anteriores, el gerente estaba un poco "despistado". No 
parecía muy apropiado analizar el nivel de satisfacción a partir de la edad, y además para los clientes de fuera 
del barrio no parecía muy relevante la percepción de la calidad del parking a la hora de entender mejor su nivel 
de satisfacción. Quizá lo que estaba pasando era que no se podía considerar una buena aproximación la 
utilización del parking con el hecho de ser o no del barrio. 
 
Para tratar de averiguarlo, quiso relacionar la utilización del parking con el sexo, y también con el día de visita 
al centro comercial: ¿hombres y mujeres usan igualmente el parking, aunque lo hagan el fin de semana o en 
día laborable? ¿los fines de semana se usa más el parking, independientemente de que seas del barrio o no? 
Para ayudar al gerente a responder a estas cuestiones, se pide responder a los siguientes apartados: 
 
3.1 Realizad una tabla de contingencia entre la variable sexo como factor (SEXOR) y la variable utilización del 
parking como factor (P14_M23R). ¿A qué conclusión se llega? Razonad los resultados. 
 
 
 
 
 
 
 
 
 
 
 
PEC2. ANÁLISIS BIVARIANTE 
Página 6 de 6 
 
En la tabla de contingencia tenemos que para el estadístico Chi-cuadrado el p – valor es de 0,09461 > 0,05 
por lo tanto no podemos rechazar la hipoitesis nula de la prueba que en este caso seria que el sexo y la 
utilizacion del parking son independientes. Por lo tanto no podemos asegurar estadisticamente que el sexo 
y la utilizacion del parking este relacionados. 
 
3.2 Realizad una tabla de contingencia entre el hecho que la visita se haga el fin de semana o en día laborable, 
y la variable utilización del parking como factor (P14_M23R). ¿A qué conclusión llegáis? ¿Creéis que la 
utilización del parking tiene más a ver con el sexo o con el día de visita al centro comercial? Razonad las 
respuestas. 
Nota: Para responder esta pregunta tenéis que crear una nueva variable (FINDER) a partir de la variable DIA_ENTREV 
(1=Lunes, 2=Jueves, 3=Viernes, 4=Sábado) como factor. Al crear la variab le FINDER hacedlo de forma que tome 
dos valores (0 y 1) en función de si el día es laborable (valor 0) o si es de fin de semana (valor 1). 
 
 
 
En la tabla de contingencia tenemos que el p – valor del estadístico Chi-cuadrado es 0,6226 > 0,05 por lo 
tanto podemos afirmar que existe independencia entre las dos variables. Lo cual significa que no podemos 
afirmar estadisticamente que el dia de la semana influya en usar mas o menos el parking. 
 
3.3 Realizad una tabla de contingencia entre la variable DIA_ENTREV como factor (FINDER) y la variable 
SEXO como factor (SEXOR). ¿A qué conclusión llegáis? Razonad vuestras respuestas. 
 
 
En la tabla de contingencia tenemos que el p – valor del estadístico Chi-cuadrado es 0,455 > 0,05 por lo 
tanto podemos al igual que en la prueba anterior, afirmar que existe independencia entre las dos variables . 
Paras este caso no existe relacion entre el sexo y los dias de visita al centro comercial. 
 
3.4 ¿Por qué no tiene sentido hacer un análisis de correlaciones, o una regresión lineal, entre las variables 
consideradas en esta pregunta? Razonad la respuesta. 
 
 
Las variables consideradas en esta pregunta son cualitativas dicotómicas (SEXOR, P14_M23R) o 
cualitativas nominales (FINDER) el coeficiente de correlación lineal de Pearson requiere que la variable 
independiente sea cuantitativa y la explicada como mínimo cualitativa ordinal, condiciones que no se 
cumplen en las variables estudiadas.

Continuar navegando

Contenido elegido para ti

111 pag.
estadistica-basica-con-R

User badge image

Contenidos Diversos

48 pag.
18 pag.
010

Gimn Comercial Los Andes

User badge image

Santana Satnas

29 pag.