Logo Studenta

UNIDAD 7-ANOVA

¡Este material tiene más páginas!

Vista previa del material en texto

ANÁLISIS DE LA VARIANZA (ANOVA)
Planteo de un problema:
Reproducir la figura compleja de Rey
requiere de memoria de trabajo y de
aplicación de estrategias.
Esta prueba se administra para evaluar
la organización perceptual y la
memoria visual.
1
Figura compleja de Rey
En una primera etapa el paciente la copia sin límite de
tiempo y, de inmediato, se le pide que la reproduzca sin la
ayuda del modelo.
Luego de 30 minutos se le pide nuevamente que la
reproduzca para evaluar su capacidad de recuerdo
material no verbal.
2
El puntaje máximo posible de la prueba es de 36 porque
en su desarrollo se evalúa la confección de 36 items.
En nuestro ejemplo se estudia a pacientes que se quejan de
falta de memoria (grupo Queja), y se los quiere comparar
con pacientes sin patología (grupo Control), y con
pacientes que ya están diagnosticados con Deterioro
cognitivo leve (grupo MCI). En ese contexto, se les
administra la prueba de la figura de Rey a los individuos de
los tres grupos.
3
Los tratamientos los 
indicamos con un subíndice i. 
i = 1; 2; 3
Yi= puntaje obtenido por los 
individuos que pertenecen al 
grupo o tratamiento i. 
µi= puntaje medio de la 
población de individuos del 
grupo o tratamiento i.
Estos son los datos obtenidos de la prueba:
Yij: Puntaje obtenido por el j-ésimo individuo que
pertenece al grupo i.
En este problema hay 1
criterio de clasificación que
es el grupo o tratamiento,
que lo fija el experimentador
y lo denominamos con el
subíndice i:
1  i  I = 3 niveles
El subíndice j indica el
individuo dentro del grupo:
1  j  ni
j:
1

ni
i: 
1I
Yij = Y2 6
4
Yij: Respuesta del j-ésimo individuo que recibió el
tratamiento i.
5
La H0 indica que las tres medias son iguales
H0) 1 = 2 = 3
La H1 es complementaria de H0
H1) no todas las i son iguales
1- ¿Se puede afirmar, con pequeña probabilidad de error,
que las medias (puntajes medios en nuestro problema) no
son las mismas en las tres poblaciones?
2- Si hay diferencias, ¿cuáles son los grupos que difieren
en sus valores medios de puntaje?
Preguntas sobre el problema:
¿Cuántas comparaciones de a pares pueden plantearse
entre tres grupos?
   
3
2
2.3
!23!2
!3
2
3








Efectivamente, si las medias poblacionales a comparar se
nombran µ1, µ2 y µ3, las comparaciones serán:
µ1 vs. µ2 µ1vs. µ3 µ2 vs. µ3
4
¿Por qué introducimos un procedimiento nuevo para
poner a prueba esta hipótesis? ¿Por qué no un test de
Student por cada par de medias a comparar?
7
En general, la cantidad de comparaciones de a pares entre I
medias será:
2
)1I(I
)!2I(2
)!2I)(1I(I
)!2I(!2
!I
2
I 











Si se rechaza una hipótesis de igualdad entre dos medias,
la probabilidad de equivocarse es el nivel de significación
 fijado por el experimentador.
8
Pero ahora tenemos I.(I-1)/2 = 3.2/2 = 3 hipótesis a
contrastar. ¿Cuál es la probabilidad de rechazar
incorrectamente alguna de ellas? En otras palabras, ¿cuál
es la probabilidad de cometer al menos un error de tipo I?
Entonces necesitamos otro método.
No efectuaremos el cálculo, pero es mayor que la
probabilidad de equivocarse al rechazar una sola hipótesis.
9
El Análisis de la varianza (ANOVA) es el modelo que se
aplica cuando se quieren comparar las medias de I niveles
de un factor, donde
I ≥ 2
Nosotros analizaremos el modelo de un solo factor o
criterio de clasificación de variables aleatorias
independientes (el grupo, en nuestro caso), pero hay otros
modelos de ANOVA que efectúan comparaciones en más
de un criterio de clasificación, y en medidas
independientes o apareadas.
El tratamiento i se aplica a ni unidades experimentales
elegidas al azar.
10
MODELO DEL ANOVA:
Yij = respuesta de la unidad experimental j que recibió
el Tratamiento i
Suposiciones:Yij ~ N(i ; ) independientes 
 i = 1; 2;...; I  j = 1; ... ; ni
Para cada i fijo, las variables Yij constituyen una muestra 
aleatoria de la variable Yi .
11
Para cada tratamiento i fijo, las respuestas Yij serán iguales
a la respuesta media para ese tratamiento, más una variable
aleatoria que representa el error experimental.
i = 1; 2;...; IYij = i + Eij j = 1; ... ; ni
Suposiciones: Eij ~ N(0 ; ) independientes 
 i = 1; 2;...; I  j = 1; ... ; ni
Otra forma de expresar el modelo de ANOVA:
12
HIPÓTESIS:
H1) no todas las i son iguales
H0) 1 = 2 = ... = I
Analicemos estas causas de variación de los datos, previo
acuerdo de algunas nomenclaturas:
El nombre de Análisis de la varianza para el método
proviene del hecho de que, para comparar medias, se
evalúan las causas de variación presentes en las muestras
de observaciones.
¿Cómo llegamos a un estadístico de prueba adecuado para 
evaluar esta hipótesis?
¿Por qué no tienen los 
mismos valores de la 
variable de respuesta los 
individuos de los diferentes 
grupos?
13
Causas o fuentes de variación:
Grupo o tratamiento 
diferente
(Variación controlada 
por el experimentador)
¿Por qué no todos los 
individuos de un mismo 
grupo tienen los mismos 
valores de la variable de 
respuesta?
Diferencias individuales, 
errores de medición de la 
variable, efecto del medio 
ambiente, etc.
(Variación no controlada 
y/o no controlable)
 
ji
ji
i
i.. Y
n
1
T
n
1
n
T
Y
14
Notaciones y fórmulas:
n = número total de individuos
Ti = suma o Total de las respuestas del 
Tratamiento i
T = Total general o suma de todas las
respuestas
.iY = media muestral del Tratamiento i
..Y = media muestral general 
 
 i
i
I
1i
i nnn
 
ji i
iji TYT

j
jii YT

j
ji
ii
i
.i Y
n
1
n
T
Y
15
i.i )Y(E 
)Y(E .. ˆY..
ESTIMADORES DE LOS PARÁMETROS
 = respuesta media del total de la población sin tener 
en cuenta el tratamiento.
i.i
ˆY 
= media de la muestra aleatoria correspondiente 
al Tratamiento i.
.iY
..Y = media muestral general (de todos los datos 
sin tener en cuenta el tratamiento) 
i = respuesta media poblacional al Tratamiento i.
16
Analicemos la variación de los datos, para lo cual
descompondremos la variación total en dos causas de
variación:
Para encontrar un estimador de la varianza en el modelo de
ANOVA, recordemos el cálculo del estimador de la
varianza S2 con los datos de una sola muestra:
Suma de Cuadrados:
22 ˆCM
gl
SC
S 



n
1i
2
i )XX(SC
Grados de libertad: gl = n-1
17
Variación total Variación dentro
de tratamientos
Variación entre
tratamientos
 ..Y-Y ji    ...i.iji Y-YY-Y 
Partición de la variación total:
 
ij
2
ji ..Y-Y      
ij
2
...i.iji Y-YY-Y
        
ij
2
...i...i.iij
2
.iji YYYY.YY.2YY
Planteemos la Suma de Cuadrados:
Luego de desarrollar la sumatoria dentro de cada sumando, 
el doble producto da igual a cero
18
     2...2.i2 Y-Y-..- ∑∑∑ i
i
iji
ji
ji
ji
YnYYY 
Suma de 
cuadrados
Total
SCT
Suma de 
cuadrados
Dentro
SCD
Suma de 
cuadrados
Entre
SCE
(n – 1) = (n - I) + (I – 1) 
Grados de libertad
Cuadrados medios:
Entonces:
= +
In
SC
CM DENTRODENTRO


1I
SC
CM ENTREENTRE


19
E(CMD) = 
2
Demostrar
Entonces el CMDENTRO es el que estima la variación no
controlada, es decir:
2
DENTRO
ˆCM 
Y además:
El CMDENTRO es un estimador insesgado
de la varianza poblacional
Propiedad 7.1 :





i
i
i
2
ii
DENT RO
)1n(
S)1n(
CM
Propiedad 7.2 :
20
Veamos las fuentes de variación en las dos situaciones:
I) Supongamos que H0 es falsa:
Y..
_
Y1.
_
Y2.
_
Y3.
_
CME >> CMD
Y1.
_
Y2.
_
Y3.
_
Y..
_ CME  CMD
II) Supongamos que H0 es verdadera:
21
Entonces, si al ser falsa la hipótesis nula lo que cambia es
la relación entre los Cuadrados Medios Entre y Dentro, el
Estadístico de prueba debería contenerlos. ¿En qué tipo de
relación matemática?
Recordemos que el Estadístico de pruebadebe detectar
cuándo la H0 es falsa y que, además, debe tener una
distribución conocida.
Y recordemos, además, que los cuadrados medios son
varianzas, y que son variables aleatorias.
22
¿Cuál será el valor crítico para rechazar la hipótesis nula?
)In();1I(;3210 Fsi:HchazaremosRe  F
E(CMD) = 
2 


i
2
ii
2
E n
1I
1
CME )(
Si H0 no es verdadera, algún i  0, entonces
0n
i
2
ii
 E(CME ) > 2  E(CME ) > E(CMD) 
αi = µi - µ
Por lo tanto, si H0 es verdadera, todas las µi son iguales a µ y todos 
los αi son iguales a 0.
Entonces se puede calcular la esperanza de los CM:
)(;)1(~pruebadeoEstadístic InI
DENTRO
ENTRE F
CM
CM
F 
23
2
)1(2
~
)1(


I
entreCMI 

2
)(2
~
)(
In
dentroCMIn




Así también (no lo demostraremos):
Entonces:
)();1(
2
2
~
1)(
1
1)1(
InI
dentro
entre
F
In
CMIn
I
CMI



















Por la suposición de homogeneidad de varianzas
2
12
21
)n(~
S)n(




Recordemos que
¿Por qué la distribución del estadístico?
24
Los resultados se presentan, en general, en una tabla:
Tabla del ANOVA:
Fuente de 
variación
Suma de 
cuadrados
(SC)
Grados de 
libertad 
(gl)
Cuadrado medio
(CM)
Estadístico de 
prueba (F)
Entre 
tratamientos
SC ENTRE I – 1 CME = SCE/(I-1) F = CME / CMD
Dentro de 
tratamientos
SC DENTRO n – I CMD = SCD/(n-I)
Total SC TOTAL n - 1
La P del test, la probabilidad exacta de cometer error de
tipo I, es la P(F(I-1); (n-I) ≥ Fmuestral ), es decir, el área a la
derecha del Estadístico de prueba calculado.
25
Recordemos:
     2..2.i2 Y-Y-- ∑∑∑ .i
i
iji
ji
ji
ji
YnY..YY 
Para completar la tabla del ANOVA necesitamos
desarrollar estas fórmulas para obtener una fórmula útil
desde el punto de vista computacional. Así, desarrollando
los cuadrados se obtiene:
CYSC
ji
2
jiT 
C
n
T
SC
i i
2
i
E 
SCD = SCT – SCE
n
T
C
2

Donde:
SCTOTAL SCDENTRO SCENTRE
26
7273,9870
22
466
n
T
C
22


2727,1399
7273,987011270
C)15...3518(
CYSC
222
ij
2
ijT




6298,6607273,98703571,10531
7273,9870
7
102
8
166
7
198
C
n
T
SC
222
i i
2
i
E















6429,7386298,6602727,1399SCSCSC ETD 
En nuestro ejemplo:
30
Los puntajes medios difieren significativamente
entre los grupos
27
Fuente de 
variación
Suma de 
cuadrados
(SC)
Grados de 
libertad 
(gl)
Cuadrado medio
(CM)
Estadístico de 
prueba (F)
Entre 
tratamientos
660,6298 2 330,3149 8,497
Dentro de 
tratamientos
738,6429 19 38,8759
Total 1399,2727 21
52,3F 19;2;05,0 
93,5F 19;2;01,0 
8,497 > 5,93  Se rechaza H0
con P<0,01
30
0,00 0,93 1,85 2,78 3,70 4,63 5,56 6,48 7,41
0,0
0,2
0,5
0,7
1,0
D
e
n
s
id
a
d
Función de densidad
F-Snedecor(2,19): p(evento)=0,05
28
F0,05;2;19=3,52
29
Verifiquemos mediante la fórmula de cálculo del Sp
2
generalizada para más de dos tratamientos:
8759,38
19
6427,738
676
9524,43)17(3571,39)18(2381,33)17(2 


pS
n-I
SCDENTRO
CMDENTRO
Recordemos la Propiedad





i
i
i
2
ii
DENT RO
)1n(
S)1n(
CM
27
30
ANOVA en Excel
31
32
ANOVA en InfoStat Base de datos en InfoStat:
Una columna es el grupo y otra la variable
Cómo llegar a este
cuadro de diálogo
Estadísticas
Análisis de la Varianza
(Se pasan las variables
mediante las flechas
y se le da Aceptar)
33
Cuando aparece este cuadro de diálogo, tildar Residuos, Residuos
estudentizados y Predichos
Los residuos y los predichos
se agregan a la base de datos.
)ˆ( Residuo iij YY 
El residuo es la diferencia
entre el valor observado y el 
valor esperado o predicho
según el modelo. 
Observar que los predichos son las medias de cada grupo.
Es decir que en el ANOVA, los residuos son:
)( Residuo .iij YY 
34
35
-15,0 -9,0 -3,0 3,0 9,0 15,0
Cuantiles de una Normal(4,0372E-016,35,173)
-15,0
-9,0
-3,0
3,0
9,0
15,0
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(R
D
U
O
_
P
u
n
ta
je
)
n= 22 r= 0,984 (RDUO_Puntaje)
QQ-Plot
Normal una de muchoaparten se no residuos los que esperamos
Ê comoy 
);0(~Econ :ANOVA de modelo elSegún 
ij
ij
ij
ijiij
residuo
NEμY

 
Verificación de supuestos:
36
10,0 15,0 20,0 25,0 30,0
PRED_Puntaje
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
2,5
R
E
_
P
u
n
ta
je
1616
Gráfico de residuos estudentizados en función de predichos
Se espera que no haya valores más allá de los 3 desvíos estándar.
En el gráfico están marcadas con rojo dos líneas sobre los ± 2 DS.
Un solo valor está a más de 2 DS: es el dato de la fila 16.
37
Test de Hartley o del F máximo:
H0: σ1
2 = σ2
2 = … = σI
2
H1: no todas las σi
2 son iguales
Test para evaluar la homogeneidad de varianzas:
2
MENOR
2
MAYOR
S
S
oEstadístic máxF
1J;I;máx0 FsiHrechazaSe máxF
Yij = respuesta del j-ésimo individuo que recibió el
tratamiento i
Suposiciones:Yij ~N(i ; i) independientes
 i = 1; 2;...; I  j = 1; ... ; J
No se rechaza la hipótesis de homogeneidad de varianzas.
No se encuentran diferencias significativas entre las
varianzas correspondientes a los tres grupos.
38
Por supuesto, se espera no rechazar la hipótesis nula de
igualdad de varianzas. Por lo tanto, para disminuir la
probabilidad de cometer error de tipo II, debemos fijar un
nivel de significación  alto, digamos como mínimo 10%.
Si todos los ni no son iguales, se puede calcular la media
armónica de los ni o bien ubicarse en la situación más
desfavorable y utilizar como J el tamaño de la muestra de
mayor tamaño.
En nuestro ejemplo:
32,1
2381,33
9524,43
máxF 94,6F 7;3;05,0máx máxF
39
Test de Levene:
H0: σ1
2 = σ2
2 = … = σI
2
H1: no todas las σi
2 son iguales
Yij = respuesta del j-ésimo individuo que recibió el
tratamiento i
Suposiciones:Yij ~N(i ; i) independientes
 i = 1; 2;...; I  j = 1; ... ; J
El método consiste en efectuar un Análisis de varianza
con la variable de respuesta: “Residuos Absolutos del
modelo del ANOVA”; y como variable de clasificación, el
grupo o tratamiento.
40
Test de Levene en InfoStat
. absoluto Residuo iij YY 
Recordemos que Residuo es el valor observado de una 
variable menos el valor esperado según el modelo
. Residuo iij YY 
CONTROL QUEJA MCI
-14,0
-10,5
-7,0
-3,5
0,0
3,5
7,0
10,5
14,0
R
D
U
O
_
P
u
n
ta
je
CONTROL QUEJA MCI
0,0
2,0
4,0
6,0
8,0
10,0
12,0
14,0
R
A
B
S
_
P
u
n
ta
je
41
No se puede rechazar la hipótesis de homogeneidad de varianzas: 
p-valor=0,9045
Test de Levene
42
Transformaciones de los datos: soluciones posibles a la
falta de cumplimiento de los supuestos:
Suele suceder que, al aumentar la media, aumenta
proporcionalmente la desviación estándar o la varianza de los
grupos. Se puede recurrir a las transformaciones de los datos.
Esta transformación es útil cuando i es proporcional a µi
Transformación logaritmo: Y´= log (Y) o Y´= ln (Y)
Se utiliza cuando i
2 es proporcional a µi. Suele usarse cuando la
variable proviene de recuentos: por ejemplo, número de células en
un volumen determinado; número de pacientes que concurren a un
servicio en un intervalo de tiempo determinado (Poisson)
Transformación raíz cuadrada: Y´Y 
43
Transformación Arcoseno: Ysenarc´Y 
Se utiliza cuando Y = proporción que proviene de un recuento de
número de éxitos en m repeticiones independientes de un
experimento (distribución Binomial). El arc sen es la función
inversa del seno de un ángulo.
Transformación recíproca: 
Y
1
´Y 
Se utiliza cuando i es proporcional a µi
2 Es la transformación
indicada cuando la variable es un tiempo de sobrevida, o un tiempo
de espera hasta un evento.
44
Propiedades 
*Si hay sólo dos tratamientos (I=2) el ANOVA de un
factor fijo es equivalente al test de Student de diferencia
de medias en muestras independientes con la hipótesis:
H0) 1 - 2 = 0 H1) 1 - 2  0
*Elestadístico F no cambia si se hace una transformación
lineal a los datos. Se obtiene el mismo resultado si se
modifica la unidad de medición.
45
Comparaciones múltiples
Después de rechazar la hipótesis nula del ANOVA, se
necesita saber dónde están las diferencias; en general, en
comparaciones de a pares. Los tests de comparaciones
múltiples, o tests a posteriori, se efectúan con un nivel de
significación global  que asegura que, aunque se
rechazaran todas las comparaciones, no se superaría ese
nivel de significación (se controla el error de tipo I).
En nuestro ejemplo, nos interesa saber si los individuos
que se quejan de la falta de memoria están más cerca de
los controles o de los pacientes con deterioro cognitivo.
46
Para poner a prueba las hipótesis se calculan los
estadísticos de prueba y se los confronta a un valor de tabla
adecuado.
H0 i i´: μi = μi´
H1 i i´: μi  μi´
Si se comparan I medias de a pares, 
la cantidad total de comparaciones será:
m = I(I-1)/2
Hay diversos métodos para controlar el error de tipo I. 
Las hipótesis nulas y alternativas, cuando se comparan las
medias de a pares, son de la forma:
 i = 1; ... ; I  i' = 1; ... ; I i  i'
47
Método de Bonferroni
La premisa del método para controlar la probabilidad de
error de tipo I es: si se pretende no sobrepasar el nivel de
significación α para m comparaciones, entonces el nivel de
significación para cada una de las m comparaciones será
* =  / m
Para encontrar el estadístico de prueba, necesitamos un
estimador de µi - µi´  ´.ii´ii YYˆˆ 
0
´
´.
~
11
0.
T Hbajot
nn
CM
YY
In
ii
D
ii












48
con nivel de significación global , 
In;
m.2
´ii0 tTsi)HrechazaSe


En nuestro ejemplo de los puntajes en los tres grupos de
individuos, se rechazó H0) 1 = 2 = 3 con P < 0,01
Veremos cuáles son los grupos cuyos puntajes medios
difieren significativamente.
H012) 1 - 2 = 0 H112) 1 - 2  0
H013) 1 - 3 = 0 H113) 1 - 3  0
H023) 2 - 3 = 0 H123) 2 - 3  0
Podemos plantear hipótesis H0ii’
 
3
2
133
m 


.
49
 = 0,05 t n-I; /2m = t 19;0,05/2*3 = 2,625 (valor de tabla)
 = 0,01 t n-I; /2m = t 19; 0,01/2*3 = 3,354 (valor de tabla)
H012) 1 = 2
NS
mT 324,2
8
1
7
1
8759,38
8,203,28










H013) 1 = 3
**111,4
7
1
7
1
8759,38
6,143,28









mT
H023) 2 = 3
NS
mT 921,1
7
1
8
1
8759,38
6,148,20










50
Las conclusiones son las mismas tanto si tomamos un nivel
de significación global del 5% como del 1%: sólo se
rechaza H013). Se detecta diferencia significativa entre el
grupo Control y el grupo de Deterioro cognitivo leve, pero
el grupo de Queja no difiere significativamente de ninguno
de los dos.
Esta conclusión se puede informar así: con un código de
letras iguales para los tratamientos o grupos que no
difieren:
GRUPO MEDIA
Control 28,3 A
Queja 20,8 AB
MCI 14,6 B
51
Si la cantidad de tratamientos es muy grande, y hay muchas
comparaciones, el método de Bonferroni puede llegar a tener una
baja potencia, porque al achicarse mucho la zona de rechazo, el
estadístico de prueba debe tener un valor absoluto muy grande para
entrar en la zona de rechazo, y disminuye la capacidad de detectar
diferencias verdaderas. Si todas las comparaciones a posteriori
interesan, Bonferroni funciona bien cuando m  I, y eso sucede
cuando I=3 porque (3*2)/2 = 3
Sin embargo, cuando sólo interesa hacer un número limitado de
comparaciones, menor que I(I-1)/2, el valor de m puede ser
corregido sólo por la cantidad de comparaciones que interesan.
Por ejemplo, si se tienen 5 tratamientos, (5*4)/2=10, pero si sólo
interesan 5 de ellas, el valor de α se puede dividir por 5 en lugar de
10, y no disminuye tanto la potencia.
No obstante, cuando se efectúa Bonferroni en InfoStat, por defecto
efectúa todas las comparaciones.
52
Método de Bonferroni en InfoStat
Luego de introducir las variables 
Puntaje y Grupo, en la solapa
Comparaciones tildar
Bonferroni: se activa
automáticamente: “Mostrar
medias según Grupo”Aceptar
53
Método de Tukey o de la Mínima Diferencia Significativa
Recordemos que se rechaza H0 i i´: μi = μi´ si el estadístico:
Tukey propone el uso de la distribución del rango
studentizado con parámetros I y n-I
Si X1; X2; ...; Xk son variables aleatorias N(0;1)
independientes, e Y ~ n
2 es independiente de todas las Xi
la variable aleatoria:
n
Y
XX
W
minmax 

W sigue la distribución del
rango studentizado con
parámetros I y n-I.
tabladeValor
n
1
n
1
CM
Y.Y
 
´ii
D
´.ii











54
W ~ q I ; n-I P(W  q ;I;n-I) = 
I (la cantidad de grupos o tratamientos) 
n-I (los grados de libertad del CMDentro)
La probabilidad 
tabulada es la 
siguiente:
Fue diseñado por Tukey para tamaños de muestra iguales,
en cuyo caso el nivel de significación global α es exacto. Si
los ni no son iguales, es algo conservador (usa las medias
armónicas y rechaza menos, detecta menos diferencias): el
nivel de significación es menor que α.
55
I-n I; ;
´ii
D
´.ii
q
2
1
n
1
n
1
CM
Y.Y
 


















 
´ii
DI-n I; ;´.ii
n
1
n
1
CMq
2
1
Y.Y
J
2
CMq
2
1
Y.Y DI-n I; ;´.ii  J
CM
2q
2
1
Y.Y
D
I-n I; ;´.ii 
J
CM
qY.Y
D
I-n I; ;´.ii 

 

=MDS
(Mínima diferencia 
significativa)
ni = ni´=J
Las medias de dos tratamientos difieren significativamente
si la correspondiente diferencia de medias muestrales
supera en valor absoluto a la MDS.
56
Con nivel de significación global , se rechaza H0ii') si
La probabilidad de error al hacer todas las comparaciones
es menor o igual que .
MDSYY '.i.i 
I21 n
1
n
1
n
1
I
J



Si los ni no son iguales utilizamos la media armónica de
los ni.
57
En nuestro ejemplo:
30,7
7
1
8
1
7
1
3
J 


285,83077,2.59,3
30,7
8759,38
qMDS 19;3;05,0 
Control Queja MCI
28,3 20,8 14,6
Control 7,5NS 13,7**
Queja 6,2NS
.iY
777,103077,2.67,4
30,7
8759,38
qMDS 19;3;01,0 
En este problema, con el método de Tukey se rechazan las 
mismas hipótesis que con el de Bonferroni.
GRUPO MEDIA
Control 28,3 A
Queja 20,8 AB
MCI 14,6 B
58
Método de Tukey en InfoStat:
Luego de introducir las
variables Puntaje y Grupo, en la 
solapa Comparaciones tildar
Tukey: se activa
automáticamente: “Mostrar
medias según Grupo”Aceptar
59
Método de Dunnett para comparar Tratamientos versus un
Control (Mala noticia: InfoStat no hace Dunnett)
H0 i c: μi = μc
H1 i c : μi  μc
In1; I;
2
α
ci
D
.ci
 0ic td
n
1
n
1
CM
Y.Y
 siH rechaza Se










El test de Dunnett es un test a priori de comparaciones
múltiples entre I tratamientos, de los cuales uno es un
Control; y el objetivo es comparar los I-1 tratamientos
versus el Control.
Test de Dunnett bilateral:
Es el único test de comparciones múltiples que puede
plantear una hipótesis alternativa unilateral (una sola cola).
60
H0 i c: μi = μc
H1 i c : μi >μc
I-n1;-I;
.
 0ic td
11
.
 siH rechaza Se 








ci
D
ci
nn
CM
YY
Test de Dunnett unilateral:
H1 i c : μi <μc
En este caso, se utiliza la tabla de Dunnett de una sola cola
Si los ni son todos iguales a J, o se calcula la media
armónica de los ni, el denominador del estadístico no
depende del par de comparaciones. Entonces también se
pueden simplificar los cálculos:
61
J
CMY Dc
2
.tdY siH rechaza Se In1; I;i. 0ic  
Supongamos, en nuestro ejemplo, que queremos analizar si
los grupos de queja y de MCI tienen puntajes medios
menores que los del grupo Control, pero que no interesa
compararlos entre sí.
El valor crítico, si calculamos la media armónica, será:
30,7
2
.8759,38tdYY siH Rechazamos 19;2;05,0ci. 0ic 
625,6
30,7
2
.8759,3803,2YY ci. 
H1 2c : μ2 < μcNuestras dos hipótesis alternativas serán:
H1 3c : μ3< μc
625,65,73,288,20YY c2. 
625,67,133,286,14YY c3. 
Ambos grupos tienen puntajes medios menores que el grupo
Control, con un nivel de significación global del 5% y del 1%
62
Comparemos el valor crítico al 5% de Dunnett con respecto al
obtenido con Tukey:
625,6
30,7
2
.8759,3803,2YY ci. 
285,8
30,7
8759,38
59,3MDS 
Observamos que Dunnett tiene más potencia que Tukey, “rechaza
más”: el valor de tabla es menor y el valor crítico es menor para
Dunnett, ¿por qué?
Porque Dunnett es un método específico para comparar tratamientos
contra un Control.
Pero OJO, el método nos inhibe de efectuar otras comparaciones de
los grupos entre sí.
Control Queja MCI
28,3 20,8 14,6
Control 7,5* 13,7*
.iY
Ahora, con Dunnett, y con la posibilidad de hacerlo de una cola, se
detecta diferencia significativa entre el grupo de Queja y el grupo
Control.

Continuar navegando