Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
290 10.14 ANÁLISIS DE VARIANZA Esta prueba se utiliza para determinar si las medias muestrales provienen de poblaciones con medias iguales, cuando hay más de dos poblaciones en estudio. El análisis de varianza (ANOVA) permite comparar simultáneamente todas las medias, evitando tener que realizar pruebas en grupos de dos con las técnicas vistas anteriormente. La comparación de las medias muestrales se basa en las varianzas muestrales Suposiciones necesarias para el análisis de varianza 1) Las poblaciones tienen distribución normal 2) Las poblaciones tienen varianzas iguales 3) Las muestras son independientes Definiciones: Tratamiento: Es la fuente de datos cuya variación proporciona las observaciones. Sean. k: Número de tratamientos n: Número total de observaciones en todos los tratamientos combinados nj: Número total de observaciones en cada tratamiento j = 1, 2, ..., k xi,j: Es la i-esima observación del tratamiento j jX : Media muestral del tratamiento j (incluye las observaciones de cada tratamiento) X : Media muestral general (incluye a todas las observaciones de todos los tratamientos) Variación Total: Es la variación total combinada de las observaciones de todos los tratamientos con respecto a la media general Media muestral general: jnk i,j j 1 i 1 1X X n = = = ∑∑ Variación total: jnk 2 i,j j 1 i 1 SCT (X X) = = = −∑∑ (Suma cuadrática total) Variación de tratamientos: Es la variación atribuida a los efectos de los tratamientos Media muestral del tratamiento j: jn j i,j j i 1 1X X n = = ∑ Variación de tratamientos: k 2 jj j 1 SCTr n (X X) = = −∑ (Suma cuadrática de tratamientos) Variación aleatoria o error: Es la variación dentro de cada tratamiento debido a errores en el experimento. Variación aleatoria o error: SCE = SCT – SCTr (Suma cuadrática del error) La ecuación SCT = SCTr + SCE separa la variación total en dos componentes: el primero corresponde a la variación atribuida a los tratamientos y el segundo es la variación atribuida a la aleatoriedad o errores del experimento SCTr tiene k – 1 grados de libertad (varianza ponderada con k tratamientos) SCE tiene n – k grados de libertad (existen n datos y k tratamientos) SCT tiene n – 1 grados de libertad (suma de grados de libertad de SCTr y SCE) Si cada uno se divide por el número de grados de libertad se obtienen los cuadrados medios Todos estos resultados se los ordena en un cuadro denominado tabla de análisis de varianza 291 10.14.1 TABLA ANOVA (ANÁLISIS DE VARIANZA) Fuente de variación Grados de libertad Suma de cuadrados Cuadrados medios F0 Tratamiento k – 1 SCTr SCTr/(k – 1) (SCTr/(k – 1))/(SCE/( n–k)) Error n – k SCE SCE/( n – k) Total n – 1 SCT El último cociente es el valor de una variable que tiene distribución F. Este estadístico se usa para la prueba de hipótesis 10.14.2 PRUEBA DE HIPÓTESIS 1) Hipotesis nula Ho: µ1 = µ2 = . . . = µk (las medias poblacionales son iguales) 2) Hipótesis alterna: Ha: Ho (al menos dos medias son iguales) 3) Definir el nivel de significancia de la prueba α 4) Elegir el estadístico de prueba: Distribución F con ν1 = k – 1, ν2 = n – k g. l. Definir la región de rechazo de Ho 5) Calcular Fo 6) Decidir Ejemplo Para comparar las calificaciones promedio que obtienen los estudiantes en cierta materia que la imparten cuatro profesores, se eligieron 32 estudiantes que deben tomar esta materia y se los distribuyó aleatoriamente en los cuatro paralelos asignados a los cuatro profesores. Al finalizar el semestre los 32 estudiantes obtuvieron las siguientes calificaciones Profesor A Profesor B Profesor C Profesor D 68 80 87 56 90 73 82 80 67 68 92 71 85 67 72 91 86 49 45 80 53 67 74 56 64 63 85 67 71 60 93 53 Con una significancia de 5% determine si existe evidencia de que hay diferencia en las calificaciones promedio entre los cuatro paralelos. 1) Hipotesis nula Ho: µ1 = µ2 = µ3 = µ4 (Las 4 medias de las notas son iguales) 2) Hipótesis alterna: Ha: Ho (Al menos en dos paralelos son diferentes) 3) Nivel de significancia α = 0.05 4) Estadístico de prueba F con ν1 = 4 – 1 = 3, ν2 = 32 – 4 = 28 g. l. Región de rechazo 1 2, ,Fα ν ν = 0.05, 3, 28F = 2.95 (tabla F) Rechazar Ho si Fo > 2.95 5) Calcular Fo j jn nk 4 i,j i,j j 1 i 1 j 1 i 1 1 1 1X X X (68 90 ... 67 53) 71.7188 n 32 32= = = = = = = + + + + =∑∑ ∑∑ jnk 2 2 2 i,j j 1 i 1 SCT (X X) (68 71.7188) (90 71.7188) ... 5494.5 = = = − = − + − + =∑∑ 292 1n 1 i,1 1 i 1 1 1X X (68 90 ... 64 71) 73 n 8= = = + + + + =∑ 2n 2 i,2 2 i 1 1 1X X (80 73 ... 63 60) 65.875 n 8= = = + + + + =∑ 3n 3 i,3 3 i 1 1 1X X (87 82 ... 85 93) 78.75 n 8= = = + + + + =∑ 4n 4 i,4 4 i 1 1 1X X (56 80 ... 67 53) 69.25 n 8= = = + + + + =∑ k 2 2 2 jj j 1 SCTr n (X X) 8(73 71.7188) 8(65.875 71.7188) ... 730.6 = = − = − + − + =∑ SCE = SCT – SCTr = 5494.5 – 730.6 = 4763.9 730.6SCTr 3k 1Fo 1.4314SCE 4763.9 n k 28 −= = = − 6) Decisión: Fo no cae en la región de rechazo. Por lo tanto no se puede rechazar la hipótesis de que las medias de las calificaciones de los cuatro paralelos son iguales 10.14.3 EJERCICIOS Para comparar la efectividad de cuatro tipos de fertilizantes para cierto tipo de producto, se dividió una zona de cultivo en veinte parcelas de igual tamaño y se administraron cada uno de los fertilizantes en cinco parcelas elegidas aleatoriamente. Al finalizar el periodo de cultivo se registraron las cantidades del producto obtenidas en las parcelas asignadas a cada tipo de fertilizante con los siguientes resultados, en las unidades de medida que corresponda: Fertilizante A Fertilizante B Fertilizante C Fertilizante D 27 26 24 23 21 23 26 27 24 20 27 26 23 26 22 23 28 23 24 25 Con una significancia de 5% determine si existe evidencia de que hay diferencia en las cantidades promedio del producto que se obtuvieron con los cuatro tipos de fertilizante. 10 ESTADÍSTICA INFERENCIAL 10.14 ANÁLISIS DE VARIANZA 10.14.1 TABLA ANOVA (ANÁLISIS DE VARIANZA) 10.14.2 PRUEBA DE HIPÓTESIS 10.14.3 EJERCICIOS
Compartir