Logo Studenta

ANOVA - Análisis de la Varianza

¡Este material tiene más páginas!

Vista previa del material en texto

ANALISIS DE LA VARIANZA
ANOVA
ANOVA: Qué es?
Es un procedimiento que analiza la variación total de una variable respuesta, descomponiéndola en porciones independientes y significativas, atribuibles a cada una de las variables independientes y a variación casual.
ANOVA
Variación Total
Variación 
entre
grupos
Variación
dentro de los 
grupos 
=
+
Ejemplo de aplicación
 Un fabricante está interesado en estudiar la resistencia a la tensión de una fibra sintética, 
 y sospecha que puede depender del 
 porcentaje de algodón en su composición. Con este fin, estudia la resistencia de la fibra considerando 5 niveles de porcentaje de algodón en su composición. Los datos observados se muestran en la siguiente tabla:
Resultado del relevamiento de datos
(mediciones)
	Tensión 
de
ruptura	Contenido de algodón				
		15%	20%	25%	30%	35%
		7	12	14	19	7
		7	17	18	25	10
		15	12	18	22	11
		11	18	19	19	15
		9	18	19	23	11
Probar si el fabricante está acertado en su sospecha, al 5% de significación.
Conceptos básicos
Variable dependiente o variable respuesta
Variable independiente o factor
Nivel o tratamiento del factor
Unidad experimental
Error experimental
Aleatorización
Variable dependiente o 
variable respuesta
Es la variable que interesa medir o respuesta que se va a estudiar para determinar el efecto que tiene sobre ella la variable independiente.
Variable independiente o factor
Es la variable o factor que puede influenciar en la variabilidad de la respuesta o variable dependiente. También llamada tratamiento.
Nivel o tratamiento del factor
Es un valor o condición del factor bajo el cual se observa la respuesta medible.
Unidad experimental
Es el objeto (persona, animal o cosa) donde se aplica un determinado tratamiento, para obtener una medición de la variable respuesta.
Error experimental
Es la variación que no se puede atribuir a un cambio de tratamiento; es decir, la que se produce por los factores extraños que pueden influir en la respuesta y que deben ser eliminados o controlados por el investigador.
Aleatorización
Consiste en asignar en forma aleatoria los tratamientos a las unidades experimentales con el propósito de remover los posibles sesgos sistemáticos y neutralizar los efectos de todos aquellos factores externos que no se encuentran bajo el control del investigador, pero pueden estar presentes en el experimento.
ANOVA. Cuándo se utiliza…
Cuando es necesario hacer comparaciones entre tres o más medias muestrales 
para determinar si provienen 
de poblaciones iguales.
ANOVA. El modelo…
i-ésima observación del 
j-ésimo tratamiento
Media general de todas
las observaciones
Efecto del j-ésimo tratamiento
Términos de error 
o residuales
ANOVA. Supuestos básicos
Las poblaciones siguen una Distribución de Probabilidad Normal
Las poblaciones tienen varianzas ( ) iguales
Las muestras se seleccionan de modo independiente
Los residuales son independientes, con distribución normal, con E( ) = 0 y varianza igual a 
ANOVA. Un solo factor o variable independiente con “c” niveles o tratamientos
Hipótesis a probar
 
 
Dos formas
Referidas a las poblaciones y/o 
a las medias
En función de los efectos de los tratamientos
Hipótesis sobre poblaciones y/o medias
H0: Las medias de las c poblaciones son iguales
H1: No todas las medias de las c poblaciones son iguales
H0: μ1 = μ2 = μ3 = … = μc
H1: Alguna de las medias difiere
O también
Hipótesis en función de los efectos 
de los tratamientos
H0: Los tratamientos no producen efecto
H1: Alguno de los tratamientos produce efecto
O también
H0: 1 = 2 = 3 = …= c
H1: Algún  es diferente
Para probar esta hipótesis …
Se toma una muestra aleatoria de cada una de las c poblaciones y se examina la cantidad de variación dentro de cada una de estas muestras en relación con la cantidad de variación entre las muestras.
Siguiendo con las etapas de la prueba de hipótesis
Nivel de significación:
Estadístico de prueba: ~ 
Bajo el supuesto de que H0 es verdadera.
Criterio de decisión: Rechazar H0 si, solo si
				Fc 
Es una prueba unilateral de cola derecha.
Los cuadrados medios
Los cuadrados medios son los estimadores 
de la varianza común 
El estadístico de prueba es:
Las sumas de cuadrados
Con n-1 grados de libertad
Con c-1 grados de libertad
Con n-c grados de libertad
Para la etapa de Cálculos la tabla de datos resultados del relevamiento tiene la forma siguiente: 
	Tratamiento o niveles del factor					
	1	2	…	j	…	c
	y11	y12	…	y1j	…	y1c
	y21	y22	…	y2j	…	y2c
	…	…	…	…	…	…
	yi1	yi2	…	yij	…	yic
	…	…	…	…	…	…
	yn1	yn2	…	ynj	…	ync
	T.1	T.2	…	T.j	…	T.c
	n1	n2	…	nj	…	nc
			…		…	
Donde:
T.j son los totales de los tratamientos 
nj son los tamaños muestrales
 son las medias muestrales
Las fórmulas para el cálculo son las siguientes:
El número total de observaciones realizadas
La suma de las observaciones realizadas
La media del j-ésimo tratamiento
La media general de todas 
las observaciones
ANOVA. El análisis
SCT = SCTr + SCE
Suma de cuadrados Total
=
Suma de cuadrados de
Tratamientos
+
Suma de cuadrados 
de Error
Los resultados se presentan en la
	TABLA DE ANOVA				
	Fuente de Variación	Grados de Libertad	Suma de Cuadrados	Cuadrados
Medios	Fc
	Tratamientos	c-1	SCTr		
	Error	n-c	SCE		
	Total	n-1	SCT		
Decisión
 Si Fc > 
 Si Fc no es mayor que 
 Se rechaza H0
No existen evidencias suficientes para rechazar H0 
Conclusión
Si se rechaza la hipótesis nula, la conclusión es que alguna de las medias de tratamientos es estadísticamente distinta de las demás.
 O también que el efecto de los tratamientos produce diferencias estadísticamente significativas en la variable respuesta.
Conclusión
Si no se rechaza la hipótesis nula, la conclusión es que las medias de los tratamientos son estadísticamente iguales entre sí.
 O también que el efecto de los tratamientos no produce diferencias estadísticamente significativas en la variable respuesta.
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
+
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
÷
÷
ø
ö
ç
ç
è
æ
grupos
dentrode
Variación
grupos
entre
Variación
TOTAL
VARIACIÓN
ij
j
ij
y
e
a
m
+
+
=
2
s
ij
e
a
=
)
(
1
e
P
CME
CMTr
Fc
=
)
(
)
1
(
c
n
y
c
F
-
-
2
s
1
-
=
c
SCTr
CMTr
c
n
SCE
CME
-
=
(
)
(
)
n
T
Y
SCT
c
j
n
i
ij
j
2
1
1
2
..
-
ú
û
ù
ê
ë
é
=
å
å
=
=
(
)
(
)
n
T
n
T
SCTr
c
j
j
j
2
1
2
.
..
-
ú
ú
û
ù
ê
ê
ë
é
=
å
=
SCTr
SCT
SCE
-
=
1
.
y
2
.
y
j
y
.
c
y
.
å
=
=
c
j
j
n
n
1
å
=
=
c
j
j
T
T
1
.
..
i
n
i
ij
j
n
y
y
i
å
=
=
1
.
c
y
n
y
y
c
j
j
n
i
c
j
ij
i
å
å
å
=
=
=
=
=
1
1
1
.
..
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
+
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
÷
÷
ø
ö
ç
ç
è
æ
os
tratamient
dentrode
Variación
os
tratamient
entre
Variación
TOTAL
VARIACIÓN

Continuar navegando