Logo Studenta

Análise de Variância (ANOVA) com GNU R

¡Estudia con miles de materiales!

Vista previa del material en texto

Universidad Autónoma de Nuevo León
Facultad de IngenieríaMecánica y Eléctrica
ANOVA
Ing. Sergio DavidMadrigal Espinoza, Dr.
Diseño de experimentos
29 de enero de 2021
1 / 27
Contenido
Análisis de varianza (ANOVA) y GNU R
Diseño cuadrado latino (tres factores)
Diseño cuadrado grecolatino
2 / 27
Análisis de varianza
Los cálculos asociados a los diseños factorial
pueden ser acomodados en un cuadro que contiene
los valores más importantes de las pruebas de
manera ordenada y compacta. A éste se denomina
cuadro ANOVA, que corresponde a las siglas en
inglés de análisis de varianza.
3 / 27
Cuadro ANOVA (Unifactorial)
Grados de Suma de Cuadrado TS p–valor
libertad cuadrados (SS) medio (MS)
Cols. (c) n − 1 m
n∑
j=1
(X̄j − X̄)2
SSc
n − 1
MSc
MSe
P
{
Fn−1,n(m−1) ≥ TS
}
Error (e) n(m − 1)
m∑
i=1
n∑
j=1
(Xij − X̄j)2
SSe
n(m − 1)
Note que:
SSc = m
n∑
j=1
(X̄j − X̄)2 = m(n − 1)S̄2,
y
SSe =
m∑
i=1
n∑
j=1
(Xij − X̄j)2 =
n(m − 1)
n
n∑
i=1
S2i .
4 / 27
Cuadro ANOVA (Bifactorial)
Grados de Suma de Cuadrado TS p–valor
libertad cuadrados (SS) medio (MS)
Renglones (r) m − 1 n
m∑
i=1
(Xi· − X··)2
SSr
m − 1
MSr
MSe
P
{
Fm−1,N ≥ TS
}
Columnas (c) n − 1 m
n∑
j=1
(X·j − X··)2
SSc
n − 1
MSc
MSe
P
{
Fn−1,N ≥ TS
}
Error (e) N SSe
SSe
N
donde:
N = (m − 1)(n − 1),
SSe =
m∑
i=1
n∑
j=1
(Xij − Xi· − X·j + X··)2.
Observe que:
SSr = n(m − 1)Var(Xi·),
SSc = m(n − 1)Var
(
X·j
)
.
5 / 27
ANOVA en GNU R
Existe mucho software para crear cuadros ANOVA
de manera rápida y eficiente. GNU R es un
programa orientado al cómputo estadístico, 100 %
gratuito y de código abierto. Puede descargarse
desde el sitio: http://cran.itam.mx/
6 / 27
Ejemplo
Determine el cuadro ANOVA correspondiente al
ejemplo de tasas de mortalidad (diseño
unifactorial).
7 / 27
Solución
Df Sum Sq Mean Sq Fvalue Pr(>F)
fc 3 69.95 23.316 6.247 0.005 **
Residuals 16 59.72 3.733
8 / 27
http://cran.itam.mx/
Solución con GNU R
> r1 <- c(33.6, 31.4, 29.8, 32.1)
> r2 <- c(32.5, 30.1, 28.5, 29.9)
> r3 <- c(35.3, 33.2, 29.5, 28.7)
> r4 <- c(34.4, 28.6, 33.9, 30.1)
> r5 <- c(37.3, 34.1, 28.5, 29.4)
> y <- c(r1, r2, r3, r4, r5)
> fc <- factor(rep(1:4, times = 5))
> y.aov <- aov(y ~ fc)
> summary(y.aov)
Df Sum Sq Mean Sq F value Pr(>F)
fc 3 69.95 23.316 6.247 0.00519 **
Residuals 16 59.72 3.733
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
9 / 27
Ejemplo
Utilice GNU R para encontrar el cuadro ANOVA
correspondiente a los datos de las calificaciones.
10 / 27
Solución con R
> r1 <- c(75, 73, 60, 70, 86)
> r2 <- c(78, 71, 64, 72, 90)
> r3 <- c(80, 69, 62, 70, 85)
> r4 <- c(73, 67, 63, 80, 92)
> y <- c(r1, r2, r3, r4)
> fr <- factor(rep(1:4, each = 5))
> fc <- factor(rep(1:5, times = 4))
> y.aov <- aov(y ~ fr + fc)
> summary(y.aov)
Df Sum Sq Mean Sq F value Pr(>F)
fr 3 20.4 6.8 0.591 0.633
fc 4 1457.5 364.4 31.662 2.72e-06 ***
Residuals 12 138.1 11.5
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
11 / 27
Ejemplo
Utilice GNU R para encontrar el cuadro ANOVA
correspondiente a los datos de puntuaciones de
efectividad de detergentes y lavadoras.
12 / 27
Solución con R
> r1 <- c(53, 50, 59)
> r2 <- c(54, 54, 60)
> r3 <- c(56, 58, 63)
> r4 <- c(50, 45, 58)
> y <- c(r1, r2, r3, r4)
> fr <- factor(rep(1:4, each = 3))
> fc <- factor(rep(1:3, times = 4))
> y.aov <- aov(y ~ fr + fc)
> summary(y.aov)
Df Sum Sq Mean Sq F value Pr(>F)
fr 3 102.0 34.00 8.681 0.0133 *
fc 2 154.5 77.25 19.723 0.0023 **
Residuals 6 23.5 3.92
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
13 / 27
Contenido
Análisis de varianza (ANOVA) y GNU R
Diseño cuadrado latino (tres factores)
Diseño cuadrado grecolatino
14 / 27
Universidad Autónoma de Nuevo León
Facultad de Ingenierı́a Mecánica y Eléctrica
Actividad 4 del curso de Diseño de experimentos
Alumno: Matrı́cula
Orden de Operador
ensamblaje 1 2 3 4
I
Cβ Bγ Dδ Aα
11 10 14 8
II
Bα Cδ Aγ Dβ
8 12 10 12
III
Aδ Dα Bβ Cγ
9 11 7 15
IV
Dγ Aβ Cα Bδ
9 8 18 6
En el diseño experimental anterior, se muestran los resul-
tados de un experimento en el que un ingeniero industrial
investiga el efecto de cuatro métodos de ensamblaje (A, B,
C y D) sobre el tiempo de ensamblaje de un componente
de televisores a color. Se seleccionan cuatro operadores
para el estudio. Además, el ingeniero sabe que todos los
métodos de ensamblaje producen fatiga, de tal modo que
el tiempo requerido para el último ensamblaje puede ser
mayor que el primero, independientemente del método.
Se sospecha también, que el sitio de trabajo influye en el
tiempo de ensamblado (α, β, γ y δ).
1. 40 puntos Escriba un código en el lenguaje GNU
R, para crear un objeto aov asociado a este problema.
2. 40 puntos ¿Cuál es el resultado de aplicar la ins-
trucción summary() al objeto anterior?
3. 20 puntos ¿Qué se concluye para cada factor? Uti-
lice α = 0.05.
Pregunta: 1 2 3 Total
Puntos: 40 40 20 100
Calificación:
Se estudia el efecto de tres factores en una variable
de respuesta. Cada factor está compuesto por k
niveles. Por ejemplo, si k = 4, los resultados del
experimento pueden acomodarse así:
Columnas
Renglones 1 2 3 4
I A B D C
II D C A B
III B D C A
IV C A B D
16 / 27
Las letras A, B, C y D, representan los distintos
niveles de un tercer factor. Además de letras, cada
celda contendrá un valor de la variable de respuesta,
obtenido con cada nivel de los tres factores. Este es
un ejemplo de un diseño cuadrado latino.
17 / 27
Ejemplo
El siguiente experimento, trata de probar la
viabilidad de reducir la contaminación atmosférica,
modificando una mezcla de gasolina con pequeñas
cantidades de aditivos A, B, C y D. Estos cuatro
tratamientos, fueron probados por cuatro
conductores y en cuatro diferentes coches. El
resultado se muestra en el siguiente cuadrado latino:
18 / 27
Coches
Conductores 1 2 3 4
I
A B D C
19 24 23 26
II
D C A B
23 24 19 30
III
B D C A
15 14 15 16
IV
C A B D
19 18 19 16
Determine la influencia de cada factor sobre las emisiones.
19 / 27
Solución I
> r1 <- c(19, 24, 23, 26)
> r2 <- c(23, 24, 19, 30)
> r3 <- c(15, 14, 15, 16)
> r4 <- c(19, 18, 19, 16)
> y <- c(r1, r2, r3, r4)
> fr <- factor(rep(1:4, each = 4))
> fc <- factor(rep(1:4, times = 4))
> l1 <- c('A', 'B', 'D', 'C')
> l2 <- c('D', 'C', 'A', 'B')
> l3 <- c('B', 'D', 'C', 'A')
> l4 <- c('C', 'A', 'B', 'D')
> fl <- factor(c(l1, l2, l3, l4))
> y.aov <- aov(y ~ fr + fc + fl)
> summary(y.aov)
20 / 27
Solución II
Df Sum Sq Mean Sq F value Pr(>F)
fr 3 216 72.00 13.5 0.00447 **
fc 3 24 8.00 1.5 0.30717
fl 3 40 13.33 2.5 0.15649
Residuals 6 32 5.33
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
21 / 27
Contenido
Análisis de varianza (ANOVA) y GNU R
Diseño cuadrado latino (tres factores)
Diseño cuadrado grecolatino
22 / 27
Diseño cuadrado grecolatino
Un cuadrado grecolatino, es aquel que está
compuesto de cuatro factores: renglones, columnas,
letras latinas y letras griegas.
23 / 27
Ejemplo
Se compara el rendimiento de cinco tipos de diésel
(A, B, C, D, E) para tractores. Se emplea a cinco
tractoristas en cinco días de la semana y en
diferentes períodos del día (α, β, γ, δ, �). La
respuesta se mide en km/galón.
24 / 27
Ejemplo
Tracto- Día de la semana
rista 1 2 3 4 5
I Aα Bγ C� Dβ Eδ10 16 23 24 20
II Bβ Cδ Dα Eγ A�15 20 25 20 18.5
III Cγ D� Eβ Aδ Bα21.5 24 25 16.5 19
IV Dδ Eα Aγ B� Cβ20 32 14 18 27
V E� Aβ Bδ Cα Dγ30 12 17.5 25 30
Determine la significación de los factores. Utilice α = 0.05.
25 / 27
Solución con R I
> r1 <- c(10, 16, 23, 24, 20)
> r2 <- c(15, 20, 25, 20, 18.5)
> r3 <- c(21.5, 24, 25, 16.5, 19)
> r4 <- c(20, 32, 14, 18, 27)
> r5 <- c(30, 12, 17.5, 25, 30)
> y <- c(r1,r2,r3,r4,r5)
> fr <- as.factor(rep(1:5, each = 5))
> fc <- as.factor(rep(1:5, times = 5))
> l1 <- c('A','B','C','D','E')
> l2 <- c('B','C','D','E','A')
> l3 <- c('C','D','E','A','B')
> l4 <- c('D','E','A','B','C')
> l5 <- c('E','A','B','C','D')
> fl <- as.factor(c(l1,l2,l3,l4,l5))
> g1 <- c('a','g','e','b','d')
> g2 <- c('b','d','a','g','e')> g3 <- c('g','e','b','d','a')
> g4 <- c('d','a','g','e','b')
26 / 27
Solución con R II
> g5 <- c('e','b','d','a','g')
> fg <- as.factor(c(g1,g2,g3,g4,g5))
> y.aov <- aov(y ~ fr + fc + fl + fg)
> summary(y.aov)
Df Sum Sq Mean Sq F value Pr(>F)
fr 4 62.5 15.63 1.067 0.43229
fc 4 33.0 8.26 0.564 0.69600
fl 4 495.1 123.78 8.451 0.00568 **
fg 4 48.9 12.24 0.835 0.53935
Residuals 8 117.2 14.65
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
27 / 27
	Análisis de varianza (ANOVA) y GNU R
	Diseño cuadrado latino (tres factores)
	Diseño cuadrado grecolatino

Continuar navegando

Materiales relacionados

230 pag.
MATLAB_PROGRAMACION

UNIP

User badge image

Maria Alejandra Tamayo Medina

111 pag.
estadistica-basica-con-R

User badge image

Contenidos Diversos

336 pag.
Probabilidad_y_estadistica_basica

SIN SIGLA

User badge image

Alejandra Romina Godoy