Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ANÁLISIS DE VARIANZA Análisis de varianza ■ Una de las pruebas estadísticas más usadas en ciencias de la conducta, de la salud y educación ■ Este procedimiento fue desarrollado por Fisher para probar hipótesis que involucran p≥2 poblaciones ■ Este análisis usa un diseño donde los participantes/sujetos están repartidos de forma aleatoria en 2 o más condiciones de tratamiento ■ Análisis de varianza = ANOVA Análisis de varianza ■ Las hipótesis que se van a probar son del siguiente tipo: H0: 𝜇1= 𝜇2 = … = 𝜇p H1: 𝜇j ≠ 𝜇j’ (2 poblaciones diferentes) ■ Si se rechaza la H0, quiere decir que por lo menos 2 medias poblacionales no son iguales ¡Ojo! No significa que todos las medias poblacionales son diferentes, puede que solamente 2 difieran. ¿Porqué no usar t de Student? Porque incrementa la probabilidad de cometer un error tipo I à inaceptable! Conceptos básicos ■ ¿Qué representa el valor de una puntuación en un experimento? à mezcla / compuesto de efectos - De la variable independiente - De las características individuales de un participante o unidad experimental - De las fluctuaciones debidas al azar en el desempeño del participante - Del ambiente y de otras variables no controladas ■ De forma similar, la variabilidad entre cada resultado de un experimento es también un compuesto de los efectos de esas mismas variables Conceptos básicos ■ ANOVA es un procedimiento para determinar qué parte de la variabilidad total entre las puntuaciones se atribuye a varias fuentes de variación y para probar hipótesis sobre algunas de las fuentes ■ Ejemplo: Experimento donde se quiere determinar la eficacia de 3 dietas sobre niñas adolescentes obesas. 30 niñas que quieren bajar de peso son asignadas de forma aleatoria a las dietas (n=10 para c/u) ■ Variable independiente: tipo de dieta ■ Variable dependiente: perdida de peso después de un mes de dieta Conceptos básicos ■ Dietas = Tratamiento A con diferentes niveles, correspondientes a las diferentes dietas, anotados a1, a2 y a3. ■ Una puntuación en particular se denotará Xij, donde i designa uno de los i = 1, …, n participantes en un nivel de tratamiento y j designa uno de los j = 1 , … , p niveles del tratamiento a. Ejemplo: X72 designa el peso perdido por Marie en el experimento y los subíndices nos indican que es la participante 7 y que usó la dieta a2 ¿Qué puede haber afectado el resultado de Marie? Conceptos básicos ■ ¿Qué puede haber afectado el resultado de Marie? 1. Efecto del tratamiento a2 2. Efectos únicos para ella 3. Efectos atribuibles a fluctuaciones fortuitas en su comportamiento 4. Efectos atribuibles a variables ambientales y otras variables no controladas Conceptos básicos Scanned with CamScanner Scanned with CamScanner Conceptos básicos Scanned with CamScanner Scanned with CamScanner ■ Gran media de todos los resultados $𝑋 · · Conceptos básicos ■ Efecto del tratamiento: efecto de la variable independiente $𝑋 · j - $𝑋 Por ejemplo, el efecto de la dieta a2 sobre la perdida de peso de Marie ■ Efecto de error: los efectos exclusivos del participante i que recibió el nivel de tratamiento aj y cualquier otra variable no controlada que afectó el resultado, Xij - $𝑋 · j Por ejemplo, el efecto de error de Marie incluye su grado de obesidad, las fluctuaciones diarias en sus hábitos, y la hora de pesaje Conceptos básicos ■ Así se puede representar cada resultado con la siguiente ecuación: Xij = $𝑋 · · + ( $𝑋 · j - $𝑋 · · ) + ( Xij - $𝑋 · j ) Ejemplo: X72 = 8 X72 = $𝑋 · · + ( $𝑋 · 2 - $𝑋 · · ) + ( X72 - $𝑋 · 2 ) 8 = 9.67 + (9 - 9.67) + (8 – 9) 8 = 9.67 + (-0.67) + (-1) Puntuación Gran media Efecto del tratamiento Efecto del error Scanned with CamScanner Puntuación de Marie Gran media Efecto del tratamiento a2 Efecto del error de Marie Partición de la suma total de los cuadrados ■ Variabilidad total entre las puntuaciones de un experimento llamada suma total de los cuadrados (SSTO) Scanned with CamScanner Scanned with CamScanner Compuesta de la variabilidad entre los niveles de tratamiento, llamada suma de cuadrados entre grupos (SSBG) Y la variabilidad dentro de los niveles de tratamiento, llamada suma de cuadrados dentro de grupos (SSWG) Scanned with CamScanner Partición de la suma total de los cuadrados ■ SSTO = SSBG + SSWG Compuesta de la variabilidad entre los niveles de tratamiento, llamada suma de cuadrados entre grupos (SSBG) Y la variabilidad dentro de los niveles de tratamiento, llamada suma de cuadrados dentro de grupos (SSWG) Grados de libertad ■ Asociado a SSBG: p – 1 donde p es el número de tratamientos ■ Asociado a SSWG: p (n-1) ■ Asociado a SSTO: si n1 = n2 = … = np : np - 1 si los nj no son iguales : (n1+n2+… + np) -1 = N – 1 Ejemplo: La media cuadrática ■ También llamado valor cuadrático medio, raíz de la media cuadrática o RMS (del inglés root mean square) ■ Otro nombre de la varianza muestral &𝜎2 ■ ¿Cómo se obtiene? ■ MSTO = SSTO / (np-1) = SSTO / (N-1) ■ MSBG = SSBG / (p-1) ■ MSWG = SSWG / [p(n-1)] = SSWG / (N-p) Estadístico F ■ La hipótesis nula H0: 𝜇1= 𝜇2 = … = 𝜇p se puede probar gracias al estadístico F, el cual es la razón de la varianza entre grupos entre la varianza dentro de cada grupo F = ()*+ (),+ ■ Los grados de libertad del numerador y denominador son: υ1 = p – 1 y υ2 = p (n-1), respectivamente Naturaleza de MSBG y MSWG Para un diseño de ANOVA totalmente aleatorizado donde las medias poblacionales son iguales: Varianza del error poblacional F = ()*+(),+ = ./01 ./01 = 1 Cuando 2 o más medias poblacionales no son iguales los valores esperados de MSBG y MSWG difieren: Función de los efectos del tratamiento Naturaleza de MSBG y MSWG Scanned with CamScanner / [p(n-1)] MSWG = Estimación de la variación entre sujetos que fueron tratados igual / (p-1)MSBG = Scanned with CamScanner Estimación de la variación entre sujetos que fueron tratados diferente Naturaleza de MSBG y MSWG Scanned with CamScanner / [p(n-1)] MSWG = Estimación de la variación entre sujetos que fueron tratados igual / (p-1)MSBG = Scanned with CamScanner Estimación de la variación entre sujetos que fueron tratados diferente Diseño completamente aleatorizado Diseño completamente aleatorizado Diseño completamente aleatorizado Dieta a1 a2 a3 $𝑋 · j 8.00 9.00 12.00 &𝜎2 2.21 2.21 2.31 Scanned with CamScanner Diseño completamente aleatorizado F .05;2,27 = 3.35 Procedimientos de comparaciones múltiples ■ ¿Cuáles poblaciones no son iguales? ■ Comparaciones post-hoc: – Fisher’s LSD (Least Significant Difference) (no usar) – Tukey’s HSD (Honestly Significant Difference) – Método de Scheffé – La prueba Neuman-Keuls – t de Dunnet Todos se parecen a pruebas t Comparan pares de medias (comparaciones múltiples) ■ Corrección de Bonferroni: fijar un error tipo I más estricto Ejemplo: 4 comparaciones entonces 𝛼 = 0.05 / 4 = 0.0125 Procedimientos de comparaciones múltiples ■ ¿Cuáles poblaciones no son iguales? ■ Comparaciones post-hoc: – Fisher’s LSD (Least Significant Difference) (no usar) – Tukey’s HSD (Honestly Significant Difference) – Método de Scheffé – La prueba Neuman-Keuls – t de Dunnet Todos se parecen a pruebas t Comparan pares de medias (comparaciones múltiples) ■ Corrección de Bonferroni: fijar un error tipo I más estricto Ejemplo: 4 comparaciones entonces 𝛼 = 0.05 / 4 = 0.0125 ANOVA factorial ■ Permite evaluar la posible interracción entre 2 factores ■ Tiene 2 o más tratamientos y los niveles de cada tratamiento son investigados en combinación con los del otro tratamiento ■ La prueba de interacción es exclusiva de los diseños factoriales. ■ Se dice que exsite una interacción entre 2 tratamientos si las diferencias en los resultados bajo los niveles de un tratamiento son diferentes en 2 o más niveles del otro tratamiento Dietas a1 a2 a3 Sedentarias Ejercicio Ejercicio■ Relacionar: a) Suma de cuadrados (entre grupos) b) Sumas de cuadrados (dentro de cada grupo) c) Media cuadrática (entre grupos) d) Media cuadrática (dentro de cada grupo) e) Grados de libertad (entre grupos) f) Grados de libertad (dentro de cada grupo) g) Estadístico F 1. Relacionado con el tamaño del efecto 2. Relacionado con la variacion aleatoria dentro de cada grupo 3. Incrementa con el número de grupos 4. Incremento con el número de sujetos en cada grupo 5. Disminuye con el número de sujetos por grupo 6. Disminuye a medida que aumenta la relación señal / ruido
Compartir