ANOVA

Análisis Estadístico

•
UNAM

andreasaga1525
6/11/2023
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Análisis Estadístico

10.147 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
ANÁLISIS DE 
VARIANZA
Análisis de varianza
■ Una de las pruebas estadísticas más usadas en 
ciencias de la conducta, de la salud y educación
■ Este procedimiento fue desarrollado por Fisher 
para probar hipótesis que involucran p≥2 
poblaciones
■ Este análisis usa un diseño donde los 
participantes/sujetos están repartidos de forma 
aleatoria en 2 o más condiciones de tratamiento
■ Análisis de varianza = ANOVA
Análisis de varianza
■ Las hipótesis que se van a probar son del siguiente 
tipo:
H0: 𝜇1= 𝜇2 = … = 𝜇p
H1: 𝜇j ≠ 𝜇j’ (2 poblaciones diferentes)
■ Si se rechaza la H0, quiere decir que por lo menos 2 
medias poblacionales no son iguales
¡Ojo! No significa que todos las medias poblacionales 
son diferentes, puede que solamente 2 difieran.
¿Porqué no usar t de Student?
Porque incrementa la probabilidad de cometer un error 
tipo I à inaceptable!
Conceptos básicos
■ ¿Qué representa el valor de una puntuación en un 
experimento? à mezcla / compuesto de efectos
- De la variable independiente
- De las características individuales de un participante o 
unidad experimental
- De las fluctuaciones debidas al azar en el desempeño 
del participante
- Del ambiente y de otras variables no controladas
■ De forma similar, la variabilidad entre cada resultado de 
un experimento es también un compuesto de los efectos 
de esas mismas variables 
Conceptos básicos
■ ANOVA es un procedimiento para determinar qué 
parte de la variabilidad total entre las 
puntuaciones se atribuye a varias fuentes de 
variación y para probar hipótesis sobre algunas 
de las fuentes
■ Ejemplo: Experimento donde se quiere determinar la 
eficacia de 3 dietas sobre niñas adolescentes obesas. 
30 niñas que quieren bajar de peso son asignadas de 
forma aleatoria a las dietas (n=10 para c/u)
■ Variable independiente: tipo de dieta
■ Variable dependiente: perdida de peso después de un 
mes de dieta
Conceptos básicos
■ Dietas = Tratamiento A con diferentes niveles, 
correspondientes a las diferentes dietas, anotados a1, a2
y a3.
■ Una puntuación en particular se denotará Xij, donde i 
designa uno de los i = 1, …, n participantes en un nivel 
de tratamiento y j designa uno de los j = 1 , … , p niveles 
del tratamiento a.
Ejemplo: X72 designa el peso perdido por Marie en el 
experimento y los subíndices nos indican que es la 
participante 7 y que usó la dieta a2
¿Qué puede haber afectado el resultado de Marie?
Conceptos básicos
■ ¿Qué puede haber afectado el resultado de 
Marie?
1. Efecto del tratamiento a2
2. Efectos únicos para ella
3. Efectos atribuibles a fluctuaciones fortuitas en 
su comportamiento
4. Efectos atribuibles a variables ambientales y 
otras variables no controladas
Conceptos básicos
Scanned with CamScanner
Scanned with CamScanner
Conceptos básicos
Scanned with CamScanner
Scanned with CamScanner
■ Gran media de todos los resultados $𝑋 · ·
Conceptos básicos
■ Efecto del tratamiento: efecto de la variable 
independiente $𝑋 · j - $𝑋
Por ejemplo, el efecto de la dieta a2 sobre la perdida de 
peso de Marie
■ Efecto de error: los efectos exclusivos del 
participante i que recibió el nivel de 
tratamiento aj y cualquier otra variable no 
controlada que afectó el resultado, Xij - $𝑋 · j
Por ejemplo, el efecto de error de Marie incluye su grado 
de obesidad, las fluctuaciones diarias en sus hábitos, y la 
hora de pesaje
Conceptos básicos
■ Así se puede representar cada resultado con 
la siguiente ecuación:
Xij = $𝑋 · · + ( $𝑋 · j - $𝑋 · · ) + ( Xij - $𝑋 · j )
Ejemplo: X72 = 8
X72 = $𝑋 · · + ( $𝑋 · 2 - $𝑋 · · ) + ( X72 - $𝑋 · 2 )
8 = 9.67 + (9 - 9.67) + (8 – 9)
8 = 9.67 + (-0.67) + (-1)
Puntuación Gran 
media
Efecto del 
tratamiento
Efecto del 
error
Scanned with CamScanner
Puntuación
de Marie
Gran 
media
Efecto del 
tratamiento a2
Efecto del error 
de Marie
Partición de la suma total de los cuadrados
■ Variabilidad total entre las puntuaciones de un 
experimento llamada suma total de los 
cuadrados (SSTO)
Scanned with CamScanner
Scanned with CamScanner
Compuesta de la variabilidad entre los niveles 
de tratamiento, llamada suma de cuadrados 
entre grupos (SSBG)
Y la variabilidad dentro de los niveles de 
tratamiento, llamada suma de cuadrados dentro 
de grupos (SSWG)
Scanned with CamScanner
Partición de la suma total de los cuadrados
■ SSTO = SSBG + SSWG
Compuesta de la variabilidad entre los niveles 
de tratamiento, llamada suma de cuadrados 
entre grupos (SSBG)
Y la variabilidad dentro de los niveles de 
tratamiento, llamada suma de cuadrados dentro 
de grupos (SSWG)
Grados de libertad
■ Asociado a SSBG: p – 1 donde p es el número 
de tratamientos
■ Asociado a SSWG: p (n-1)
■ Asociado a SSTO:
si n1 = n2 = … = np : np - 1
si los nj no son iguales :
(n1+n2+… + np) -1 = N – 1
Ejemplo:
La media cuadrática 
■ También llamado valor cuadrático medio, raíz de la 
media cuadrática o RMS (del inglés root mean square)
■ Otro nombre de la varianza muestral &𝜎2
■ ¿Cómo se obtiene?
■ MSTO = SSTO / (np-1) = SSTO / (N-1)
■ MSBG = SSBG / (p-1)
■ MSWG = SSWG / [p(n-1)] = SSWG / (N-p)
Estadístico F
■ La hipótesis nula H0: 𝜇1= 𝜇2 = … = 𝜇p se puede probar 
gracias al estadístico F, el cual es la razón de la 
varianza entre grupos entre la varianza dentro de cada 
grupo
F = ()*+
(),+
■ Los grados de libertad del numerador y denominador 
son: υ1 = p – 1 y υ2 = p (n-1), respectivamente
Naturaleza de MSBG y MSWG
Para un diseño de ANOVA 
totalmente aleatorizado donde las 
medias poblacionales son iguales: Varianza del 
error poblacional
F = ()*+(),+ = 
./01
./01
= 1
Cuando 2 o más medias 
poblacionales no son iguales los 
valores esperados de MSBG y 
MSWG difieren:
Función de los 
efectos del 
tratamiento
Naturaleza de MSBG y MSWG
Scanned with CamScanner
/ [p(n-1)] MSWG = Estimación de la variación entre sujetos que fueron tratados igual
/ (p-1)MSBG = 
Scanned with CamScanner
Estimación de la variación entre 
sujetos que fueron tratados diferente
Naturaleza de MSBG y MSWG
Scanned with CamScanner
/ [p(n-1)] MSWG = Estimación de la variación entre sujetos que fueron tratados igual
/ (p-1)MSBG = 
Scanned with CamScanner
Estimación de la variación entre 
sujetos que fueron tratados diferente
Diseño completamente aleatorizado
Diseño completamente aleatorizado
Diseño completamente aleatorizado
Dieta
a1 a2 a3
$𝑋 · j 8.00 9.00 12.00
&𝜎2 2.21 2.21 2.31
Scanned with CamScanner
Diseño completamente aleatorizado
F .05;2,27 = 3.35
Procedimientos de comparaciones múltiples
■ ¿Cuáles poblaciones no son iguales?
■ Comparaciones post-hoc:
– Fisher’s LSD (Least Significant Difference) (no usar)
– Tukey’s HSD (Honestly Significant Difference)
– Método de Scheffé
– La prueba Neuman-Keuls
– t de Dunnet
Todos se parecen a pruebas t
Comparan pares de medias (comparaciones múltiples)
■ Corrección de Bonferroni: fijar un error tipo I más estricto
Ejemplo: 4 comparaciones entonces 𝛼 = 0.05 / 4 = 0.0125
Procedimientos de comparaciones múltiples
■ ¿Cuáles poblaciones no son iguales?
■ Comparaciones post-hoc:
– Fisher’s LSD (Least Significant Difference) (no usar)
– Tukey’s HSD (Honestly Significant Difference)
– Método de Scheffé
– La prueba Neuman-Keuls
– t de Dunnet
Todos se parecen a pruebas t
Comparan pares de medias (comparaciones múltiples)
■ Corrección de Bonferroni: fijar un error tipo I más estricto
Ejemplo: 4 comparaciones entonces 𝛼 = 0.05 / 4 = 0.0125
ANOVA factorial
■ Permite evaluar la posible interracción entre 2 factores
■ Tiene 2 o más tratamientos y los niveles de cada 
tratamiento son investigados en combinación con los del 
otro tratamiento
■ La prueba de interacción es exclusiva de los diseños 
factoriales.
■ Se dice que exsite una interacción entre 2 tratamientos si 
las diferencias en los resultados bajo los niveles de un 
tratamiento son diferentes en 2 o más niveles del otro 
tratamiento
Dietas
a1 a2 a3
Sedentarias
Ejercicio
Ejercicio■ Relacionar:
a) Suma de cuadrados (entre grupos)
b) Sumas de cuadrados (dentro de cada grupo)
c) Media cuadrática (entre grupos)
d) Media cuadrática (dentro de cada grupo)
e) Grados de libertad (entre grupos)
f) Grados de libertad (dentro de cada grupo)
g) Estadístico F
1. Relacionado con el tamaño del efecto
2. Relacionado con la variacion aleatoria dentro de cada grupo
3. Incrementa con el número de grupos
4. Incremento con el número de sujetos en cada grupo
5. Disminuye con el número de sujetos por grupo
6. Disminuye a medida que aumenta la relación señal / ruido