Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Universidad Autónoma de Nuevo León Facultad de IngenieríaMecánica y Eléctrica ANOVA Ing. Sergio DavidMadrigal Espinoza, Dr. Diseño de experimentos 29 de enero de 2021 1 / 27 Contenido Análisis de varianza (ANOVA) y GNU R Diseño cuadrado latino (tres factores) Diseño cuadrado grecolatino 2 / 27 Análisis de varianza Los cálculos asociados a los diseños factorial pueden ser acomodados en un cuadro que contiene los valores más importantes de las pruebas de manera ordenada y compacta. A éste se denomina cuadro ANOVA, que corresponde a las siglas en inglés de análisis de varianza. 3 / 27 Cuadro ANOVA (Unifactorial) Grados de Suma de Cuadrado TS p–valor libertad cuadrados (SS) medio (MS) Cols. (c) n − 1 m n∑ j=1 (X̄j − X̄)2 SSc n − 1 MSc MSe P { Fn−1,n(m−1) ≥ TS } Error (e) n(m − 1) m∑ i=1 n∑ j=1 (Xij − X̄j)2 SSe n(m − 1) Note que: SSc = m n∑ j=1 (X̄j − X̄)2 = m(n − 1)S̄2, y SSe = m∑ i=1 n∑ j=1 (Xij − X̄j)2 = n(m − 1) n n∑ i=1 S2i . 4 / 27 Cuadro ANOVA (Bifactorial) Grados de Suma de Cuadrado TS p–valor libertad cuadrados (SS) medio (MS) Renglones (r) m − 1 n m∑ i=1 (Xi· − X··)2 SSr m − 1 MSr MSe P { Fm−1,N ≥ TS } Columnas (c) n − 1 m n∑ j=1 (X·j − X··)2 SSc n − 1 MSc MSe P { Fn−1,N ≥ TS } Error (e) N SSe SSe N donde: N = (m − 1)(n − 1), SSe = m∑ i=1 n∑ j=1 (Xij − Xi· − X·j + X··)2. Observe que: SSr = n(m − 1)Var(Xi·), SSc = m(n − 1)Var ( X·j ) . 5 / 27 ANOVA en GNU R Existe mucho software para crear cuadros ANOVA de manera rápida y eficiente. GNU R es un programa orientado al cómputo estadístico, 100 % gratuito y de código abierto. Puede descargarse desde el sitio: http://cran.itam.mx/ 6 / 27 Ejemplo Determine el cuadro ANOVA correspondiente al ejemplo de tasas de mortalidad (diseño unifactorial). 7 / 27 Solución Df Sum Sq Mean Sq Fvalue Pr(>F) fc 3 69.95 23.316 6.247 0.005 ** Residuals 16 59.72 3.733 8 / 27 http://cran.itam.mx/ Solución con GNU R > r1 <- c(33.6, 31.4, 29.8, 32.1) > r2 <- c(32.5, 30.1, 28.5, 29.9) > r3 <- c(35.3, 33.2, 29.5, 28.7) > r4 <- c(34.4, 28.6, 33.9, 30.1) > r5 <- c(37.3, 34.1, 28.5, 29.4) > y <- c(r1, r2, r3, r4, r5) > fc <- factor(rep(1:4, times = 5)) > y.aov <- aov(y ~ fc) > summary(y.aov) Df Sum Sq Mean Sq F value Pr(>F) fc 3 69.95 23.316 6.247 0.00519 ** Residuals 16 59.72 3.733 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 9 / 27 Ejemplo Utilice GNU R para encontrar el cuadro ANOVA correspondiente a los datos de las calificaciones. 10 / 27 Solución con R > r1 <- c(75, 73, 60, 70, 86) > r2 <- c(78, 71, 64, 72, 90) > r3 <- c(80, 69, 62, 70, 85) > r4 <- c(73, 67, 63, 80, 92) > y <- c(r1, r2, r3, r4) > fr <- factor(rep(1:4, each = 5)) > fc <- factor(rep(1:5, times = 4)) > y.aov <- aov(y ~ fr + fc) > summary(y.aov) Df Sum Sq Mean Sq F value Pr(>F) fr 3 20.4 6.8 0.591 0.633 fc 4 1457.5 364.4 31.662 2.72e-06 *** Residuals 12 138.1 11.5 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 11 / 27 Ejemplo Utilice GNU R para encontrar el cuadro ANOVA correspondiente a los datos de puntuaciones de efectividad de detergentes y lavadoras. 12 / 27 Solución con R > r1 <- c(53, 50, 59) > r2 <- c(54, 54, 60) > r3 <- c(56, 58, 63) > r4 <- c(50, 45, 58) > y <- c(r1, r2, r3, r4) > fr <- factor(rep(1:4, each = 3)) > fc <- factor(rep(1:3, times = 4)) > y.aov <- aov(y ~ fr + fc) > summary(y.aov) Df Sum Sq Mean Sq F value Pr(>F) fr 3 102.0 34.00 8.681 0.0133 * fc 2 154.5 77.25 19.723 0.0023 ** Residuals 6 23.5 3.92 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 13 / 27 Contenido Análisis de varianza (ANOVA) y GNU R Diseño cuadrado latino (tres factores) Diseño cuadrado grecolatino 14 / 27 Universidad Autónoma de Nuevo León Facultad de Ingenierı́a Mecánica y Eléctrica Actividad 4 del curso de Diseño de experimentos Alumno: Matrı́cula Orden de Operador ensamblaje 1 2 3 4 I Cβ Bγ Dδ Aα 11 10 14 8 II Bα Cδ Aγ Dβ 8 12 10 12 III Aδ Dα Bβ Cγ 9 11 7 15 IV Dγ Aβ Cα Bδ 9 8 18 6 En el diseño experimental anterior, se muestran los resul- tados de un experimento en el que un ingeniero industrial investiga el efecto de cuatro métodos de ensamblaje (A, B, C y D) sobre el tiempo de ensamblaje de un componente de televisores a color. Se seleccionan cuatro operadores para el estudio. Además, el ingeniero sabe que todos los métodos de ensamblaje producen fatiga, de tal modo que el tiempo requerido para el último ensamblaje puede ser mayor que el primero, independientemente del método. Se sospecha también, que el sitio de trabajo influye en el tiempo de ensamblado (α, β, γ y δ). 1. 40 puntos Escriba un código en el lenguaje GNU R, para crear un objeto aov asociado a este problema. 2. 40 puntos ¿Cuál es el resultado de aplicar la ins- trucción summary() al objeto anterior? 3. 20 puntos ¿Qué se concluye para cada factor? Uti- lice α = 0.05. Pregunta: 1 2 3 Total Puntos: 40 40 20 100 Calificación: Se estudia el efecto de tres factores en una variable de respuesta. Cada factor está compuesto por k niveles. Por ejemplo, si k = 4, los resultados del experimento pueden acomodarse así: Columnas Renglones 1 2 3 4 I A B D C II D C A B III B D C A IV C A B D 16 / 27 Las letras A, B, C y D, representan los distintos niveles de un tercer factor. Además de letras, cada celda contendrá un valor de la variable de respuesta, obtenido con cada nivel de los tres factores. Este es un ejemplo de un diseño cuadrado latino. 17 / 27 Ejemplo El siguiente experimento, trata de probar la viabilidad de reducir la contaminación atmosférica, modificando una mezcla de gasolina con pequeñas cantidades de aditivos A, B, C y D. Estos cuatro tratamientos, fueron probados por cuatro conductores y en cuatro diferentes coches. El resultado se muestra en el siguiente cuadrado latino: 18 / 27 Coches Conductores 1 2 3 4 I A B D C 19 24 23 26 II D C A B 23 24 19 30 III B D C A 15 14 15 16 IV C A B D 19 18 19 16 Determine la influencia de cada factor sobre las emisiones. 19 / 27 Solución I > r1 <- c(19, 24, 23, 26) > r2 <- c(23, 24, 19, 30) > r3 <- c(15, 14, 15, 16) > r4 <- c(19, 18, 19, 16) > y <- c(r1, r2, r3, r4) > fr <- factor(rep(1:4, each = 4)) > fc <- factor(rep(1:4, times = 4)) > l1 <- c('A', 'B', 'D', 'C') > l2 <- c('D', 'C', 'A', 'B') > l3 <- c('B', 'D', 'C', 'A') > l4 <- c('C', 'A', 'B', 'D') > fl <- factor(c(l1, l2, l3, l4)) > y.aov <- aov(y ~ fr + fc + fl) > summary(y.aov) 20 / 27 Solución II Df Sum Sq Mean Sq F value Pr(>F) fr 3 216 72.00 13.5 0.00447 ** fc 3 24 8.00 1.5 0.30717 fl 3 40 13.33 2.5 0.15649 Residuals 6 32 5.33 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 21 / 27 Contenido Análisis de varianza (ANOVA) y GNU R Diseño cuadrado latino (tres factores) Diseño cuadrado grecolatino 22 / 27 Diseño cuadrado grecolatino Un cuadrado grecolatino, es aquel que está compuesto de cuatro factores: renglones, columnas, letras latinas y letras griegas. 23 / 27 Ejemplo Se compara el rendimiento de cinco tipos de diésel (A, B, C, D, E) para tractores. Se emplea a cinco tractoristas en cinco días de la semana y en diferentes períodos del día (α, β, γ, δ, �). La respuesta se mide en km/galón. 24 / 27 Ejemplo Tracto- Día de la semana rista 1 2 3 4 5 I Aα Bγ C� Dβ Eδ10 16 23 24 20 II Bβ Cδ Dα Eγ A�15 20 25 20 18.5 III Cγ D� Eβ Aδ Bα21.5 24 25 16.5 19 IV Dδ Eα Aγ B� Cβ20 32 14 18 27 V E� Aβ Bδ Cα Dγ30 12 17.5 25 30 Determine la significación de los factores. Utilice α = 0.05. 25 / 27 Solución con R I > r1 <- c(10, 16, 23, 24, 20) > r2 <- c(15, 20, 25, 20, 18.5) > r3 <- c(21.5, 24, 25, 16.5, 19) > r4 <- c(20, 32, 14, 18, 27) > r5 <- c(30, 12, 17.5, 25, 30) > y <- c(r1,r2,r3,r4,r5) > fr <- as.factor(rep(1:5, each = 5)) > fc <- as.factor(rep(1:5, times = 5)) > l1 <- c('A','B','C','D','E') > l2 <- c('B','C','D','E','A') > l3 <- c('C','D','E','A','B') > l4 <- c('D','E','A','B','C') > l5 <- c('E','A','B','C','D') > fl <- as.factor(c(l1,l2,l3,l4,l5)) > g1 <- c('a','g','e','b','d') > g2 <- c('b','d','a','g','e')> g3 <- c('g','e','b','d','a') > g4 <- c('d','a','g','e','b') 26 / 27 Solución con R II > g5 <- c('e','b','d','a','g') > fg <- as.factor(c(g1,g2,g3,g4,g5)) > y.aov <- aov(y ~ fr + fc + fl + fg) > summary(y.aov) Df Sum Sq Mean Sq F value Pr(>F) fr 4 62.5 15.63 1.067 0.43229 fc 4 33.0 8.26 0.564 0.69600 fl 4 495.1 123.78 8.451 0.00568 ** fg 4 48.9 12.24 0.835 0.53935 Residuals 8 117.2 14.65 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 27 / 27 Análisis de varianza (ANOVA) y GNU R Diseño cuadrado latino (tres factores) Diseño cuadrado grecolatino
Compartir