Logo Studenta

TALLER 3 AMV

¡Este material tiene más páginas!

Vista previa del material en texto

TALLER 3 AMV.
Profesor: Jairo Clavijo.
Estudiantes:
Laura Katherin Guzman.
Juan Javier Perez.
Hary Nicol Trujillo.
Universidad del Tolima.
Semestre A-2023
Taller 3 AMV.
Primer punto. 
Una compañía constructora está en plan de adquirir varias retroexcavadoras para lo cual hace una evaluación de un tipo de máquinas que se encuentra dentro de las perspectivas de compra. La evaluación se hace sobre tres conceptos principalmente: Desempeño de la máquina, Consumo de combustible por hora de trabajo y Facilidad de manejo. Para la evaluación se toma aleatoriamente una máquina de las que se encuentran para la venta en la agencia que las distribuye y se la hace calificar por parte de 8 operarios de ese tipo de máquinas, 10 mecánicos de la división de mantenimiento y 9 ingenieros. Para ello, se deja que estas personas manejen las máquinas durante cierto tiempo y que luego emiten una calificación entre 1 y 50 puntos por cada aspecto evaluado.
La siguiente tabla muestra los puntajes asignados como calificación por cada
evaluador.
Se deberá analizar la información proporcionada y responder las preguntas siguientes:
1. Las calificaciones otorgadas por los tres grupos de evaluadores son equivalentes o, ¿cree usted que los criterios de evaluación son dispares? las evaluamos por infostat donde hallamos que:
p < 0.001 por tanto rechazamos la hipótesis nula, tal que los tres grupos de evaluadores no son equivalentes 
2. Si no hay unanimidad en la evaluación, ¿cuál(es) grupo(s) de evaluador(es) difieren entre sí?
La prueba de corrección Bonferroni, indica que los grupos de evaluadores difieren, pues ninguna de sus tres calificaciones coinciden ya que no tienen alguna letra en común.
3. ¿En cuáles variables hay disparidad de evaluación y por parte de cuáles grupos?
Haga un análisis lo más completo posible, teniendo en cuenta que deben dar respuesta como mínimo a las tres preguntas formuladas arriba.
Calculamos la media de las medias de las tres muestras, usando infostat y procedemos a realizar los cálculos en Matlab
usamos PQRS para comprobar
ahora en matlab
podemos notar que en la media 1 con la media 2 hay dos valores que son mayores al valor crítico el cual es 3.043
en la media 1 con la media 3, en la media 2 con la media 3 todos sus valores son mayores al valor crítico, donde podemos evidenciar que en los criterios de evaluación son dispares.con ello rectificamos que los grupos difieren
Segundo punto.
Los datos siguientes, reportados por Fenelon, corresponden a toneladas de alimentos consumidos durante una temporada en 3 sectores poblacionales de Francia: Obreros, Empleados y Ejecutivos. Estos sectores han sido subdivididos según el número de hijos de las familias, a saber: familias con dos hijos o menos, familias con tres hijos, familias con 4 hijos y familias con 5 hijos o más. Las variables analizadas son: PAN, VEGETALES, FRUTAS, CARNES, AVES, LECHE Y VINO.
Se pide
1. Realizar un análisis de componentes principales y explicar las principales salidas del análisis. Usted decide si realiza ACP estandarizado o no, dando las razones para su decisión.
Realizaremos el análisis en matlab.
SOLUCIÓN. 
Decidimos usar análisis de componentes principales estandarizado para evitar que las componentes principales se vean sesgadas por escalas de las variables, partiendo de la matriz de correlaciones.
Empezamos escribiendo la matriz de los datos en matlab:
Calculamos la matriz de correlaciones con el comando corrcoef() de matlab:
Calculamos vectores y valores propios a la matriz R para el ACP estandarizado:
Construimos la matriz Q de permutaciones para poner los valores propios y los vectores propios en el orden ascendente apropiado:
>> Q = [0 0 0 0 0 0 1;0 0 0 0 0 1 0;0 0 0 0 1 0 0;0 0 0 1 0 0 0;0 0 1 0 0 0 0;0 1 0 0 0 0 0;1 0 0 0 0 0 0]
Obtenemos:
Miremos ahora el grado de explicación de las componentes:
Vemos que la varianza total es 7.
La primera componente explica:
Explica un 61.9% de la varianza total.
Las dos primeras componentes explican:
Las dos primeras componentes explican un poco más del 88% de la varianza total. En consecuencia, basta con las dos primeras componentes.
Para producir las componentes:
Lo que produce las componentes:
CP1 = -0.2396*PAN – 0.4659*VEGETALES - ... + 0.2057*VINO
CP2 = -0.6221*PAN – 0.0984*VEGETALES - ... - 0.4791*VINO
Biplot:
Hacemos el biplot para observar gráficamente la correlación existente entre las variables. Vemos que se forman grupos de variables correlacionadas, uno de ellos es carnes, aves y frutas que se encuentran altamente correlacionadas y el otro pan y leche de la misma forma. Observamos a los vegetales en la mitad de los dos grupos anteriores lo que nos indica que está medianamente correlacionado con los dos grupos mencionados anteriormente. Finalmente nos queda el vino que se encuentra en dirección opuesta al grupo de aves, carnes y frutas, lo que indica alta correlación pero de forma inversa. 
Así finalizamos el análisis de componentes principales estandarizado. 
2. Acorde con el punto anterior, realice un Análisis factorial por el método PF. Diga cómo quedan constituídos los factores y cuáles son las varianzas específicas.
SOLUCIÓN.
Ya sabemos que el criterio de Kiser nos determina que dos componentes son suficientes(punto anterior), siguiendo esto extraemos dos factores, que son las dos columnas de coeficientes de las componentes anteriores multiplicadas respectivamente por las raíces cuadradas de sus valores propios.
La matriz L nos proporciona los coeficientes para los 2 factores que buscamos:
F1 = -0.4987*PAN – 0.9698*VERDURAS - ... + 0.4282*VINO
F2 = -0.8416*PAN – 0.1331*VERDURAS - ... - 0.6482*VINO
Observando la matriz L vemos que para el primer factor los coeficientes más altos son para vegetales, frutas, carnes y aves, lo que indica que el factor 1 se conforma principalmente de ellos. Sin embargo en el segundo los coeficientes más altos son para pan, leche y vino, lo que implica que el segundo factor se compone principalmente de ellos. (Para el valor más alto no nos fijamos en el negativo del coeficiente)
Procedemos a calcular las comunalidades:
La comunalidad nos dice el porcentaje de explicación de cada variable con respecto a los factores F1 y F2. 
Concluimos que la variable menos explicada es vino, pues su porcentaje de explicación es de 60.35%, por otro lado la más explicada es carnes con un 96.21%.
Continuamos calculando las varianzas específicas, que son las diferencias
entre 1 y las comunalidades.
 
Finalmente construimos la matriz de varianzas específicas: 
3. Usando R realice un análisis factorial por el método MV. Igual que antes, diga cómo quedan constituidos los factores.
SOLUCIÓN.
Leemos los datos y asignar nombres a las variables y usamos el siguiente código:
Al correrlo:
Vemos que el valor de p es un dígito muy pequeño, así que cambiamos el n=2 por un n=3:
Vemos que el valor de p no tuvo un incremento significativo, por lo que no se puede concluir nada, pues al poner n=4 nos dice que 4 factores son demasiados para 7 variables:
por tanto podemos decir que La carne está correlacionada con las aves, podemos inferir que los vegetales no están correlacionados con las frutas, el vino no está correlacionado con ninguna de las anteriores, tal que P>0.005 no se acepta la hipótesis nula

Continuar navegando