Logo Studenta

UNIDAD 6 (con Demostraciones)

¡Este material tiene más páginas!

Vista previa del material en texto

TEST DE HIPÓTESIS
En las unidades anteriores vimos como se puede
estimar un parámetro a partir de los datos contenidos
en una muestra. Puede encontrarse ya sea, un sólo
número (estimador puntual), ó, un intervalo de valores
posibles (intervalo de confianza).
Sin embargo muchos problemas requieren que se
tome una decisión entre aceptar o rechazar una
proposición sobre algún parámetro.
Esta proposición recibe el nombre de hipótesis.
1
¿Qué es una Hipótesis?
Una hipótesis estadística es una proposición o
supuesto sobre los parámetros de una o más
poblaciones.
Ejemplo: Supongamos que nos interesa saber si la
altura media de los estudiantes del curso es de 1,65 m.
Esto puede expresarse de manera formal como dos
alternativas ó hipótesis.
2
H0: μ = 1,65 m
H1: μ  1,65 m
La proposición H0: μ = 1,65 se conoce como hipótesis nula;
mientras que la proposición H1: μ  1,65 recibe el nombre de
hipótesis alternativa.
A este procedimiento se lo conoce como prueba de hipótesis
bilateral.
Podría sólo considerarse un caso en la hipótesis alternativa,
o sea, que la hipótesis alternativa especifique valores de μ
que pueden ser mayores o menores que 1,65 m, es decir,
3
H0: μ = 1,65 m
H1: μ > 1,65 m
H0: μ = 1,65 m
H1: μ < 1,65 m
A este procedimiento se lo conoce como prueba de
hipótesis unilateral.
Es importante recordar que las hipótesis siempre
son proposiciones sobre la población bajo estudio,
no proposiciones sobre la muestra.
Un procedimiento que conduce a una decisión sobre
una hipótesis en particular recibe el nombre de
prueba de hipótesis.
Los procedimientos de prueba de hipótesis
dependen del empleo de la información contenida en
la muestra aleatoria de la población de interés.
4
Si esta información es consistente con la
hipótesis, se concluye que esta es verdadera; sin
embargo, si esta información es inconsistente
con la hipótesis, se concluye que esta es falsa.
Debe hacerse hincapié en que la verdad o
falsedad de una hipótesis en particular nunca
puede conocerse con certidumbre, a menos que
pueda examinarse a toda la población.
Usualmente esto es imposible, por tanto, es
necesario desarrollar un procedimiento de prueba
de hipótesis teniendo en cuenta la probabilidad
de llegar a una conclusión equivocada.
5
La hipótesis alternativa, representada por H1, es
la afirmación contradictoria a H0, y ésta,
generalmente, es la hipótesis a investigar.
La hipótesis nula se rechaza a favor de la
hipótesis alternativa, sólo si la evidencia
muestral sugiere que H0 es falsa. Si la muestra
no contradice decididamente a H0, se continúa
creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un
análisis por prueba de hipótesis son:
Rechazar H0 No rechazar H0
6
7
8
9
Realidad
D
ec
is
ió
n
H0 es 
Verdadera
H0 es 
Falsa
Aceptar H0
Rechazar H0
Bien
Bien
Error
Error
de tipo I
de tipo II
10
 = P(cometer error de tipo I) = 
= P(Rechazar H0 y en realidad es H0 Verdadera) 
 = P(cometer error de tipo II) = 
= P(Aceptar H0 y en realidad es H0 Falsa)
Lo que uno quisiera es que  y  fuesen pequeñas, pero si 
una disminuye la otra aumenta
 la fija el experimentador con un valor pequeño: 0,05; 0,01; ...
 puede tomar cualquier valor grande o pequeño
 = Nivel de significación del Test
11
Juez ante un acusado: sus dos hipótesis son Inocente o 
Culpable. ¿Cuál sería H0 y H1?
Principio jurídico: Toda persona es inocente hasta que se 
pruebe que es culpable
Los dos posibles errores son:
• Decidir culpable y en realidad es inocente
• Decidir inocente y en realidad es culpable
H0: Inocente H1: Culpable
 = P(Rechazar H0 si en realidad es H0 Verdadera)
 = P(Decidir culpable si en realidad es inocente) = pequeña
De las dos hipótesis posibles, lo que se quiere
probar con más seguridad se debe colocar en H1
12
Llamamos potencia de un test de hipótesis a la
probabilidad de no cometer Error de Tipo II.
 = P(rechazar H0 si en realidad H0 es falsa)
Definición de Potencia ()
 = 1 - 
Es la probabilidad de rechazar H0 si en realidad H0 es
falsa.
13
Ejemplo
Un laboratorio hace una propaganda en la que dice que el
tiempo medio en que su aspirina calma el dolor de cabeza
es menor que 15 minutos.
Otro laboratorio de la competencia, sospecha que lo que
dice la propaganda no es cierto. Quiere decidir si le hace
juicio o no acusándolo de propaganda desleal. ¿Qué
hipótesis plantearía?
X = Tiempo en que la aspirina de la propaganda calma el 
dolor de cabeza
Suposición: X ~ N(m ; s)
14
La propaganda dice: m < 15
Las dos únicas posibilidades son plantear:
H0: m  15 H1: m < 15 
H0: m  15 H1: m > 15 
Decidir m < 15 significa no acusarlo de propaganda desleal
Decidir m > 15 significa acusarlo de propaganda desleal
m = Tiempo medio en que la aspirina de la propaganda 
calma el dolor de cabeza
15
 = P(Hacer juicio acusándolo de propaganda desleal y en 
realidad la propaganda es cierta)
 = P(Decidir m > 15 y en realidad es m  15)
 = P(Rechazar H0 y en realidad es H0 Verdadera)
H0: m  15 H1: m >15 
De los dos posibles errores, el de probabilidad  será el que 
queremos controlar, es decir, el que queremos que tenga 
pequeña probabilidad de ocurrir. 
16
• Definir las variables aleatorias.
• Establecer las suposiciones necesarias.
• Plantear la hipótesis nula y la alternativa.
• Definir el estadístico de prueba.
• Fijar el nivel de significación ().
• Determinar la zona de rechazo, en función de .
• Calcular el valor del estadístico de prueba en la muestra
• Tomar la decisión.
• Interpretar la decisión en términos estadísticos.
• Interpretar la decisión en los términos del problema.
Procedimiento de test de hipótesis
Definiciones
Estadístico de prueba
Es un valor que se determina a partir de la
información de la muestra, es utilizado para decidir si
se rechaza o no la hipótesis nula.
Valor crítico
El punto que divide la región entre el lugar en el que
la hipótesis nula es rechazada y no rechazada.
17
18
Test de Gauss para una media
Suposición: X ~ N(m ; s) s es conocida
m0 es un número conocido
depende del problema
Estadístico de prueba:
Si µ = µ0 entonces Z ~ N(0;1)
Para cada una de las posibles situaciones hay que 
determinar la zona de rechazo
H0: m  m0 H1: m > m0
H0: m  m0 H1: m < m0
H0: m = m0 H1: m  m0
n
X
Z
s
m0=
19
 = P(Rechazar H0 si en realidad es H0 Verdadera)
Se rechaza H0 para valores 
grandes de Z
Zona de rechazo: Z.R.: Z  ?
? = Z 
Z.R: Z  Z
H0: m  m0 H1: m > m0
20
 = P(Rechazar H0 si en realidad es H0 Verdadera)
H0: m  m0 H1: m < m0
Se rechaza H0 para valores de 
Z muy negativos
Zona de rechazo: Z.R: Z  -?
-? = - Z 
Z.R: Z   Z 
21
 = P(Rechazar H0 si en realidad es H0 Verdadera)
H0: m = m0 H1: m  m0
Se rechaza H0 para valores de 
Z muy grandes o muy 
negativos
Zona de rechazo: Z.R.
Z  -? ó Z  ? 
? = Z /2
Z.R: Z   Z /2
Test de dos colas
22
Test de Gauss para una media
Resumen
Suposición: X ~ N(m ; s) s es conocida
Zona de Rechazo (Z.R.)
H0: m  m0 H1: m > m0 Z  Z
H0: m  m0 H1: m < m0 Z   Z 
H0: m = m0 H1: m  m0 Z   Z /2
m0 es un número conocido
Estadístico de prueba:
n
X
Z
s
m0=
23
EJEMPLO
Una muestra aleatoria de 100 muertes registradas en Estados
Unidos el año pasado, muestra una vida promedio de 71,8
años. Supongamos que la desviación estándar poblacional es
8,9 años. Queremos probar si la vida media hoy en día es
mayor a 70 años con base en esa muestra. La muestra
parecería indicar que es así, pero, ¿cuál es la probabilidad de
que la media de la muestra no refleje la verdadera media de la
población?
24
Solución
Se trata de una distribución muestral de medias con
desviación estándar conocida.
Datos
μ = 70 años
σ = 8,9 años
= 71,8 años
n = 100
α = 0,05
X
25
Establecemos las hipótesis
H0: m ≤ 70 H1: m > 70 
Nivel de significación
α = 0,05Zα = 1,645
Regla de decisión
Si Z ≤ 1,645 no se rechaza H0
Si Z > 1,645 se rechaza H0
1,645μ = 0
26
Cálculos
02,2
100
9,8
708,71
=

=

=
n
X
Z
s
m
Decisión
Como 2,02 > 1,645 se rechaza H0
Conclusión
La vida media es mayor que 70 años.
27
Ejemplo de la aspirina (de la dispositiva 14)
Se administró la aspirina a 25 personas y se obtuvo una
media muestral de 17 minutos. Suponiendo que la varianza
poblacional es 36 min2, ¿cuál será la decisión del laboratorio
con un nivel de significación del 5%?
X = Tiempo (min) en que la aspirina de la propaganda calma el 
dolor de cabeza
Suposición: X ~ N(m ; s) s conocida s = 6 
H0: m 15 H1: m >15 
n
X
Z
6
15
=
28
P(Decidir que m >15 si en realidad es m 15) =  = 0,05
 = 0,05 Z.R. Z  Z  = 1,645
Zm =1,667 > 1,645 Se rechaza H0
Se decide m > 15 ¿Cuál es la probabilidad de error?
“Tiempo medio en que la aspirina de la propaganda calma el 
dolor de cabeza es mayor que 15 minutos” 
667,1
256
1517
Zm =

=
El laboratorio decide acusarlo de propaganda desleal y 
la probabilidad de equivocarse en la decisión es 5%.
La probabilidad de error de esta afirmación es menor que 5%
29
Justificación que la condición más desfavorable, al 
determinar la zona de rechazo, ocurre si µ = 15
)1;
n/
15
(N~
n
15X
Z
s
m
s

=
H0: m  15 H1: m > 15 
Se determinó como zona de rechazo Z > 1,645
La distribución del estadístico de prueba es:
P(error de tipo I) =
P(Rechazar H0 si es verdadera) = 
= P(Z  1,645 si µ < 15) < 0,05 
30
¿Cuál hubiese sido la decisión si  = 0,01?
Z0,01 = 2,326
Z.R: Z  2,326 Zm = 1,667 < 2,326
Z.R: Z  Z
No se rechaza H0 con probabilidad de error menor que 0,01
En el test: H0: µ  µ0 H1: µ > µ0
Tomar µ = µ0 como valor de m si H0 es verdadera para
determinar la zona de rechazo Z  Z es correcto porque el
verdadero nivel de significación es menor que .
31
P = Nivel Justo de Significación es el menor  con el que 
se rechaza H0 
Si con nivel de significación  se rechaza H0 es P  
Si con nivel de significación  no se rechaza H0 es P > 
El tiempo medio en que la aspirina de la propaganda calma
el dolor de cabeza es mayor que 15 minutos.
P  0,05
32
En el ejemplo, hallar el verdadero valor de P.
Z.R: Z  Z Zm = 1,667
P = P ( Z  Zm siendo Z ~ N(0;1) ) = P ( Z  1,667) = 
= 1 – F(1,67) = 1 – 0,9525 = 0,0475
P = 0,0475
33
Representación gráfica de ,  y 
H0: m  m0
H1: m > m0
Z.R.: Z > Z 
 = P(Rechazar H0 si en realidad es 
H0 Verdadera)
 = P(Aceptar H0 si en realidad es H0
Falsa)
34
 = P(rechazar H0 si en realidad H0 es falsa)
 = P(Z  Z si µ > µ0)
35
Relación entre  y m
H0: m  m0
H1: m > m0
Z.R.: Z  Z 
 y n fijos
si m está lejos de m0
 disminuye
36
Relación entre  y 
H0: m  m0
H1: m > m0
Z.R.: Z  Z 
n fijo
si  disminuye,
 aumenta
37
Test de Student para una media
Suposición: X~N(m ; s) m y s son desconocidos
Para aplicar el test de Student para una media es necesario
verificar el cumplimiento de los supuestos del modelo.
Es decir, debemos verificar que la variable sigue una distribución
aproximadamente normal.
38
Test de Normalidad
Estos contrastes se realizan para comprobar
la hipótesis nula de que la muestra ha sido
extraída de una población con distribución
normal, se pueden realizar gráfica y
analíticamente.
El gráfico Q-Q plot representa los datos
observados de la variable frente a los datos
esperados si la distribución fuera normal. Si
los puntos están cerca de la diagonal
podemos decir que la distribución es
normal.
39
Test de Normalidad en Infostat
Prueba de normalidad en InfoStat (Shapiro-
Wilks modificado) permite probar si la variable
en estudio tiene distribución normal. Las
hipótesis de la prueba son:
H0: las observaciones tienen distribución normal
versus 
H1: las observaciones no tienen distribución normal
40
Test de Normalidad en Infostat
Ejemplo (Nadadoras Experimentador 1)
41
Test de Normalidad en Infostat
Ejemplo 
8,70 10,42 12,13 13,85 15,57
Cuantiles de una Normal(12,18,4,7951)
8,70
10,42
12,13
13,85
15,57
C
u
a
n
ti
le
s
 o
b
s
e
rv
a
d
o
s
(P
E
S
O
 M
A
S
A
 G
R
A
S
A
)
n= 10 r= 0,982 (PESO MASA GRASA)
Q-Q PLOT
42
Test de Normalidad en Infostat
Ejemplo
43
Test de Normalidad en Infostat
Ejemplo
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(Unilateral D)
PESO MASA GRASA 10 12,18 2,19 0,92 0,4872
Como p = 0,4872 (es decir, p > 0,05), no se rechaza H0,
la variable sigue una distribución aproximadamente
normal.
44
Test de Student para una media
Suposición: X~N(m ; s) m y s son desconocidos
Estadístico de prueba:
Si µ = µ0 entonces, T ~ tn-1
Para cada una de las posibles situaciones hay que
determinar la zona de rechazo
m0 es un número conocido
depende del problema
H0: m  m0 H1: m > m0
H0: m  m0 H1: m < m0
H0: m = m0 H1: m  m0
nS
X
T 0
m
=
45
 = P(Rechazar H0 si en realidad es H0 Verdadera)
H0: m  m0 H1: m > m0
Se rechaza H0 para 
valores grandes de T
Zona de rechazo: Z.R.: T > ?
? = tn-1;  Z.R: T > tn-1; 
46
 = P(Rechazar H0 si en realidad es H0 Verdadera)
H0: m  m0 H1: m < m0
Se rechaza H0 para valores de 
T muy negativos
Zona de rechazo: Z.R: T < -?
-? = - tn-1; 
Z.R: T <  tn-1; 
47
 = P(Rechazar H0 si en realidad es H0 Verdadera)
H0: m = m0 H1: m  m0
Se rechaza H0 para valores de 
T muy grandes o muy 
negativos
Zona de rechazo: Z.R.
T < -? ó T > ? 
? = tn-1; /2
Z.R: T  > tn-1; /2
Test de dos colas
48
Test de Student para una media
Resumen
Suposición: X~N(m ; s) m y s son desconocidos
Z.R.
H0: m  m0 H1: m > m0 T > tn-1; 
H0: m  m0 H1: m < m0 T < - tn-1; 
H0: m = m0 H1: m  m0 T  > tn-1; /2
Estadístico de prueba:
nS
X
T 0
m
=
49
Suposición: X ~ N(m ; s) s desconocida 
Ejemplo de la aspirina suponiendo que s es desconocida y 
que en la muestra resultó s = 6 
 = 0,05
X = Tiempo (min) en que la aspirina de la propaganda 
calma el dolor de cabeza
H0: m  15 H1: m >15 
nS
15X
T

=
nS
X
T 0
m
=
50
Z.R.: T > 1,711
Tm = 1,667 < 1,711
No se rechaza H0
Z.R. T > tn-1;  tn-1; = t24; 0,05 = 1,711
¿Cuál es la probabilidad de error al decidir H0) m  15? 
667,1
256
1517
Tm =

=
Como la decisión es aceptar H0, se comete error si H0
es Falsa.
Por lo tanto, la probabilidad de error es β.
51
Como  puede tomar cualquier valor se dice:
“m no es significativamente mayor que 15”
“El tiempo medio en que la aspirina de la propaganda calma
el dolor de cabeza no es significativamente mayor que 15
minutos”
Juez: Culpable o queda libre por falta de pruebas
• Si se rechaza H0 se afirma H1 con P < 
• Si no se rechaza H0 no se puede decir nada porque
la probabilidad de error es 
52
Test de hipótesis mediante un 
intervalo de confianza
Para un parámetro desconocido  se tiene un intervalo 
de confianza de nivel 1-: (L1 ; L2)
P (L1 <  < L2 ) = 1 - 
Se plantea un test de hipótesis de dos colas para :
H0:  = 0 H1:   0 0 es conocido
Si se toma como regla de decisión: rechazar H0 si 0 no
pertence al intervalo de confianza, el nivel de
significación de este test es 
53
Un investigador está interesado en comparar el efecto de 2
hormonas (A y B) de crecimiento sobre la longitud total
alcanzada por una leguminosa. Para ello se tomó una muestra
de 20 plantas, asignando al azar 10 a cada hormona.
Se quiere determinar si hay diferencias significativas entre los
crecimientos producidos por ambas hormonas a un nivel del
5%.
Ejemplo 1 (2 muestras)
54
X1 = crecimiento producido por la hormona A sobre la
longitud de leguminosas
X2 = crecimiento producido por la hormona B sobre la
longitud de leguminosas
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y 
X2 independientes
Planteo del problema
55
Se necesita aplicar un test de hipótesis para podertomar la 
decisión.
Se debe usar un Test para diferencia de medias
H0: m1 = m2 H1: m1  m2
56
Ejemplo 2 (2 muestras)
A 7 pacientes acromegálicos se les realizó una prueba de
tolerancia a la glucosa. A cada uno de ellos se le midió la
Glucemia (mg/dl) en ayunas y a los 120 minutos después de
tomar una dosis de glucosa.
Se quiere decidir si, en los pacientes acromegálicos, hay
variación en la glucemia media en ayunas y a los 120 minutos.
57
Suposiciones: X2 - X1 ~ N(md ; sd) X1 y X2 no son 
independientes
X1 = Glucemia (mg/dl) en ayunas en pacientes
acromegálicos
X2 = Glucemia (mg/dl) a los 120 minutos después de
tomar una dosis de glucosa en pacientes
acromegálicos
Planteo del problema
H0) m1 = m2 H1) m1  m2
Ambas mediciones se hicieron sobre las mismas
personas, X1 y X2 no son independientes, se dice
que son muestras apareadas.
58
MUESTRAS
INDEPENDIENTES PAREADAS
PRUEBAS PARA
DIFERENCIA DE 
MEDIAS
59
Test de Gauss para diferencia de 
medias en muestras independientes
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 y s2 conocidas
Estadístico de prueba:
a valor conocido,
generalmente es 0
H0: m1  m2  a H1: m1 - m2 > a
H0: m1  m2  a H1: m1  m2 < a
H0: m1  m2 = a H1: m1  m2  a
2
2
2
1
2
1
21
nn
aXX
Z
s

s

=
60
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes s1 y s2 conocidas
Se toma una muestra aleatoria de tamaño n1 de X1 y una 
muestra de tamaño n2 de X2, 
independiente de la anterior, entonces








s

s
mm
2
2
2
1
2
1
2121
nn
;N~XX
 
 1;0N~
nn
XX
2
2
2
1
2
1
2121
s

s
mm
o bien
Propiedad 6.1
Demostración
61
H0: m1  m2 a H1: m1 - m2 > a
¿Cuál es la zona de rechazo?
Si H0) es verdadera consideramos 
m1  m2 = a, entonces Z ~ N(0 ; 1)
Se rechaza H0 para valores grandes de Z
Zona de rechazo: Z.R.: Z ?
Z.R.: Z  Z
Las otras zonas de rechazo se determinan análogamente
2
2
2
1
2
1
21
nn
aXX
Z
s

s

=
62
Test de Gauss para diferencia de medias
en muestras independientes - Resumen
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 y s2 conocidas
Z.R.
H0: m1  m2  a H1: m1 - m2 > a Z  Z
H0: m1  m2  a H1: m1  m2 < a Z   Z 
H0: m1  m2 = a H1: m1  m2  a Z   Z /2
Estadístico de prueba:
2
2
2
1
2
1
21
nn
aXX
Z
ss


=
63
La variable aleatoria Y sigue distribución F de Fisher con
n1 grados de libertad en el numerador y n2 grados de
libertad en el denominador (Y ~ ) , si y sólo si
22
11
n/X
n/X
Y =
X1 ~ ; X2 ~ ; X1 y X2 independientes
21;nn
F
2
1n
 2
2n

Distribución F de Fisher
64
Si Y ~ 
P( Y > ) = 
T
A
B
L
A
21;nn
F
;; 21 nn
F
Distribución F de Fisher
65
La tabla sólo da los puntos críticos para  = 0,01
 = 0,05  = 0,10
Si se necesitan puntos críticos para
 = 0,90  = 0,95  = 0,99
hay que calcularlos a partir de los valores de la
tabla utilizando la siguiente propiedad.
Distribución F de Fisher
66
12
21
n;n;
n;n;1
F
1
F

 =
Propiedad 6.4
67
Si Y ~ tn entonces Y
2 ~ F1 ; n
Propiedad 6.5
Demostrar
68
Y ~ tn entonces
Demostración
nX
Z
Y
/
=
Z ~ N(0;1) X 
Z y X son independientes
n
X
Z
Y
2
2 = Z2 ~ 
2
1 entonces Y2 ~ F1 ; n
69
n;1;
2
n;2/ F)t(  =
Propiedad 6.6
70
X1 ~ N(μ1;σ1) ; X2 ~ N(μ2;σ2) X1 y X2 independientes
S1
2 es la varianza de una muestra aleatoria de X1 de tamaño n1
S2
2 es la varianza de una muestra aleatoria de X2 de tamaño n2
1;12
1
2
2
2
2
2
1
21
~  nnF
S
S
s
s
Propiedad 6.7
Demostrar
71
2
12
1
2
11
1
~
)1(


n
Sn
s
Demostración
2
12
2
2
22
2
~
)1(


n
Sn
s
1;1
2
2
2
2
22
1
2
1
2
11
21
~
)1(
)1(
)1(
)1(





nnF
n
Sn
n
Sn
s
s
72
Test F para comparar dos varianzas
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2
independientes
H0: s1
2  s2
2 H1: s1
2 > s2
2
H0: s1
2  s2
2 H1: s1
2 < s2
2
H0: s1
2 = s2
2 H1: s1
2  s2
2
Estadístico de prueba:
Para determinar las zonas de rechazo se debe conocer 
la distribución que sigue F si H0 es verdadera
2
2
2
1
S
S
F =
73
Habíamos visto que si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes y se toma una muestra aleatoria de
tamaño n1 de X1 y una muestra de tamaño n2 de X2 ,
independiente de la anterior, con S1
2 y S2
2 sus varianzas
muestrales, entonces
1n;1n2
1
2
2
2
2
2
1
21
F~
S
S

s
s

Si H0 es verdadera consideramos s1
2 = s2
2 
1n;1n2
2
2
1
21
F~
S
S
F =
74
 = P(Rechazar H0 si en realidad es H0 Verdadera)
Se rechaza H0 para valores grandes de F
Zona de rechazo: Z.R.: F  A
H0: s1
2  s2
2 H1: s1
2 > s2
2
 ;1n;1n 21
FA =
Z.R.: F   ;1n;1n 21F
75
H0: s1
2  s2
2 H1: s1
2 < s2
2
Se rechaza H0 para valores pequeños de F
Zona de rechazo: Z.R.: F  B
B =  1;1n;1n 21F
Z.R.: F   1;1n;1n 21F
76
H0: s1
2 = s2
2 H1: s1
2  s2
2
Z.R.: F  C o F  D 
 = P(Rechazar H0 si en realidad es H0 Verdadera)
2/1;1n;1n 21
F C = 2/;1n;1n 21F D =
Z.R.: F  2/1;1n;1n 21F  2/;1n;1n 21
F o F 
77
En la aplicación práctica de este test surge el inconveniente
que la tabla de la distribución F tiene únicamente los puntos
críticos para  = 0,01;  = 0,05 y  = 0,10 .
Para solucionar este trastorno y utilizar sólo los valores que
están en la tabla, se recurre a la siguiente regla práctica:
Para determinar las zonas de rechazo limitadas por
o por hay que emplear a la fórmula que relaciona 
F con F 1-.
2/;1n;1n 21
F 
2/1;1n;1n 21
F 
78
Regla práctica
 Al plantear el problema, elegir las variables aleatorias de 
modo que si el test es de una cola sea:
nM = tamaño de la muestra de S
2
Mayor
nm = tamaño de la muestra de S
2
menor
2
2
menor
Mayor
m
s
s
F =
H0: s1
2  s2
2 H1: s1
2 > s2
2
 El estadístico de prueba en la muestra se calcula: 
79
Siempre es Fm > 1 y sólo hay que verificar si está o no dentro de 
la zona de rechazo de la derecha
H0: s1
2  s2
2 H1: s1
2 > s2
2
 ;1n;1n mM
FF Z.R.
H0: s1
2 = s2
2 H1: s1
2  s2
2
F  2/;1n;1n mMF Z.R.
80
A un grupo de 18 varones hipertensos delgados se les da un
tratamiento con amlodipina. Nueve de ellos toman 5 mg por
día y a los otros 10 mg por día.
Al cabo de un mes se les realiza una presurometría
ambulatoria y se registra el valor de la PAS 7-23hs.
Se quiere decidir si la PAS 7-23hs media de los que toman 5
mg, difiere de la de los que toman 10 mg, determinando el
nivel justo de significación.
Aplicación
81
X1 = PAS 7-23hs de la presurometría ambulatoria de varones
hipertensos delgados después de tomar 5mg de
amlodipina por día durante un mes
X2 = PAS 7-23hs de la presurometría ambulatoria de varones
hipertensos delgados después de tomar 10mg de
amlodipina por día durante un mes
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y 
X2 independientes
H0) m1 = m2 H1) m1  m2
Se necesita aplicar un test de hipótesis para poder tomar la 
decisión.
Se debe usar un Test para diferencia de medias
82
Cuando se utiliza el test de Student para muestras
independientes hay que suponer que s1 = s2 .
Se puede aplicar el test de igualdad de varianzas para
verificar esta suposición.
Se aplicará este test en el ejemplo en que se comparaban las
dosis de 5 y 10 mg de amlodipina (Diapositiva 97)
H0: s1 = s2 H1: s1  s2 
¿Qué valor de  se elige?
Como se quiere aceptar H0, la probabilidad de error será .
Se elige  grande para que  sea pequeño.
Aplicación
83
 = 0,10 Z.R.: F > F8; 8; 0,05 = 3,44
No se rechaza H0
s1 no difiere significativamente de s2
Es válido aplicar el test de Student
• Si se rechaza H0 es s1  s2 . No puede aplicarse el test 
de Student.
• Se puede efectuar una transformación a los datos de 
manera que las varianzas sean homogéneas
• Se puede aplicar el test con la corrección de Welch.
2
2
menor
Mayor
ms
s
F =
017,1
385,5
431,5
2
2
==mF
84
Test de Student para dos medias
en muestras independientes
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2
s1 se estima con S1 y s2 se estima con S2, pero s1 = s2 = s
¿cómo se estima s? 
Con un promedio “pesado” de S1 y S2 que se llama Sp
H0: m1  m2  a H1: m1 - m2 > a
H0: m1  m2  a H1: m1  m2 < a
H0: m1  m2 = a H1: m1  m2  a
85
2nn
S)1n(S)1n(
S
21
2
22
2
112
p


=
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2 = s
Se toma una muestra aleatoria de tamaño n1 de X1 y una
muestra de tamaño n2 de X2, independiente de la anterior, S1
2
y S2
2 son sus varianzas muestrales, entonces
2
2nn2
2
p21
21
~
S)2nn(


s

pSˆ =s
Propiedad 6.2
86
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2 = s
Se toma una muestra aleatoria de tamaño n1 de X1 y una
muestra de tamaño n2 de X2, independiente de la anterior,
S1
2 y S2
2 son sus varianzas muestrales. Entonces:
 
2nn
21
p
2121
21
t~
n
1
n
1
S
XX


mm
Propiedad 6.3
87
Las zonas de rechazo para cada hipótesis alternativa se
determinan en forma similar al test de Student para una
media, sólo cambian los grados de libertad
Si H0 es verdadera consideramos m1  m2 = a, entonces
El estadístico de prueba es:
2nn 21
t~T 
21
p
21
n
1
n
1
S
aXX
T


=
88
Test de Student para dos medias
en muestras independientes 
Resumen
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2
2nn
S)1n(S)1n(
S
21
2
22
2
112
p


=Estadístico 
de prueba
H0: m1  m2  a H1: m1 - m2 > a T >
H0: m1  m2  a H1: m1  m2 < a T < -
H0: m1  m2 = a H1: m1  m2  a T >
Z.R.
 ;2nn 21
t
 ;2nn 21
t
2/;2nn 21
t 
21
21
11
nn
S
aXX
T
p 

=
89
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y 
X2 independientes, s1 = s2
H0: m1 = m2 H1: m1  m2
Ejemplo 1 
90
Los datos obtenidos fueron:
Primero se calculan la media y los 
desvíos de cada muestra.
Parece lógico suponer que
s1 = s2
n1 = n2 = 10
Ejemplo 1 (2 muestras)
Hormona 
A
Hormona 
B
10 15
10 11
13 16
12 17
10 18
8 9
12 14
11 12
16 15
15 16
Media 11,7 14,3
s 2,45 2,83
91
2nn
S)1n(S)1n(
S
21
2
22
2
112
p


=
Estadístico de prueba:
Z.R: T >
t18; 0,05/2 = 2,101 Z.R: T > 2,11
 = 0,05
Notar que si n1 = n2 entonces es:
2
SS
S
2
2
2
12
p

=
21
p
21
n
1
n
1
S
aXX
T


=
2/;2nn 21
t 
0057,7
18
)83,2.(9)45,2.(9 222 =

=ps
92
Tm = 2,1965 > 2,101 Rechazo H0
Existen diferencias significativas entre los crecimientos
producidos por ambas hormonas a un nivel del 5%.
1965,2
10
1
10
1
0057,7
3,147,11
=


=mT
93
Utilización del paquete estadístico INFOSTAT
CRECIMIENTO HORMONA
10 1
10 1
13 1
12 1
10 1
8 1
12 1
11 1
16 1
15 1
15 2
11 2
16 2
17 2
18 2
9 2
14 2
12 2
15 2
16 2
94
Utilización del paquete estadístico INFOSTAT
95
Utilización del paquete estadístico INFOSTAT
1 2
HORMONA
8
10
13
16
19
C
R
E
C
IM
IE
N
T
O
96
Utilización del paquete estadístico INFOSTAT
Prueba T para muestras Independientes
Variable:CRECIMIENTO - Clasific:HORMONA -
prueba:Bilateral
Grupo 1 Grupo 2
1 2 
n 10 10
Media 11,70 14,30
Media(1)-Media(2) -2,60
LI(95) -5,09
LS(95) -0,11
pHomVar 0,6757
T -2,20
gl 18
p-valor 0,0415
97
Test de Student para diferencia de 
medias en muestras pareadas
Suposiciones: D ~ N(md ; sd) 
X1 y X2 se miden en el mismo individuo
Se define la variable diferencia: D = X1 - X2
H0: m1  m2  a H1: m1 - m2 > a
H0: m1  m2  a H1: m1  m2 < a
H0: m1  m2 = a H1: m1  m2  a
98
Si X2 se mide antes de un tratamiento y X1 después, sobre el 
mismo individuo, D mide el efecto del tratamiento.
Suposición: D ~ N(mD; sD)
mD = m1 - m2
H0: mD  a H1: mD > a
H0: mD  a H1: mD < a
H0: mD = a H1: mD  a
Las hipótesis escriben en función de mD:
Se aplica el Test de Student para una media (mD) ya 
que sD es desconocida
99
Con los datos de la variable D se efectúa el test
Estadístico de prueba:

=
=
n
1i
iD
n
1
D
Z.R.
H0: mD  a H1: mD > a T  tn-1; 
H0: mD  a H1: mD < a T  - tn-1; 
H0: mD = a H1: mD  a T   tn-1; /2


























= 

=
=
n
1i
2
n
1i
i
2
i
2
D
n
D
D
1n
1
S
nS
aD
T
D

=
100
Ejemplo 2 (2 muestras)
Los datos siguientes corresponden a la prueba de tolerancia a
la glucosa realizada en 7 pacientes acromegálicos. Se midió
la Glucemia (mg/dl) en ayunas y a los 120 minutos después
de tomar una dosis de glucosa. Se quiere decidir si hay
variación en la glucemia media.
Paciente 1 2 3 4 5 6 7
en ayunas 81 77 85 82 97 86 78
a los 120 minutos 76 84 83 95 92 97 84
X1 = Glucemia (mg/dl) en ayunas
X2 = Glucemia (mg/dl) a los 120 minutos
Diferencia 5 -7 2 -13 5 -11 -6
101
Suposición: D ~ N(mD; sD)
H0) mD = 0 H1) mD  0
Z.R. T   tn-1; /2
 = 0,05 t6; /2 = 2,447 Z.R. T  > 2,447
D = X1 - X2 = variación de la glucemia durante la prueba
mD = m1 - m2
nS
aD
T
D

=
102
Con los 7 valores de la variable D se calcula la media y el 
desvío estándar muestral 
sD = 7,5246
No se rechaza H0
No se halló diferencia significativa entre la glucemia
media en ayunas y a los 120 minutos después de tomar la
dosis de glucosa.
57,3d =
T  =1,255 < 2,447
255,1
75246,7
57,3
=

=mT
103
Utilización del paquete estadístico INFOSTAT
EN AYUNAS A LAS 2 HORAS
81 76
77 84
85 83
82 95
97 92
86 97
78 84
104
Utilización del paquete estadístico INFOSTAT
Prueba T (muestras apareadas)
Obs(1) Obs(2) N media(dif) DE(dif) T Bilateral
EN AYUNAS A LOS 120 MINUTOS 7 -3,57 7,52 -1,26 0,2559
105
Se midió excreción urinaria de 5-HIAA (mg en 24 hs) en
pacientes con cardiopatía carcinoide y en un grupo control
sin cardiopatía carcinoide. Se obtuvieron los siguientes
datos:
Decidir si la excreción urinaria de 5-HIAA media es mayor en los
pacientes con cardiopatía carcinoide.
Ejemplo completo
X1 = excreción urinaria de 5-HIAA (mg en 24 hs) en 
pacientes con cardiopatía carcinoide
X2 = excreción urinaria de 5-HIAA (mg en 24 hs) en 
pacientes sin cardiopatía carcinoide
con 63 120 135 180 1270 274 1585 288 350 891 150 603 721
sin 28 32 43 60 73 119 124 153 854 400 588 445
106
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2
independientes; s1= s2
H0: m1  m2 H1: m1 > m2
El resumen de datos es:
con sin
Media 510 243
s 482,5 267,7
n 13 12
107
Se sospecha que no se cumple la suposición s1= s2
Se debe efectuar el test F para:
H0: s1 = s2 H1: s1  s2 
Z.R.: F > F12; 11; 0,05 = 2,79
25,3
7,267
5,482
F
2
2
m ==
108
Se rechaza H0
No se puede aplicar el test de Student. ¿Qué se hace?
Efectuamos la transformación logaritmo sobre los datos: 
Esto significa que se toma una nueva variable
Y = log X
Con los datos transformados, se calculan la media y la
varianza muestral y resulta:
Se puede efectuar una transformación a los datos o aplicar la 
corrección de Welch. 
109
No se rechaza H0
Se acepta igualdad de varianzas y se puede aplicar el test de Student 
para las medias con los datos transformados.
221,0
21213
509,011432,012
s
22
2
p =


=
log con log sin
Media 2,521 2,128
s 0,432 0,509
n 13 12
Fm < 2,72
H0: s1 = s2 H1: s1  s2 
Z.R.: F > F11; 12; 0,05 = 2,7239,1
432,0
509,0
F
2
2
m ==
110
Z.R: T > tn1+n2-2; 
t23; 0,05 = 1,714
 = 0,05
Z.R: T > 1,714
Tm = 2,09 > 1,714 Se rechaza H0
La excreción urinaria de 5-HIAA media en los pacientes
con cardiopatía carcinoide es significativamente mayor
que en los pacientes sin cardiopatía carcinoide. P < 0,05
09,2
12
1
13
1
221,0
128,2521,2
Tm =


=
111
Procedimientos a seguir si no secumplen 
las suposiciones del test de Student para 
diferencia de medias en muestras 
independientes
• Hay dos variables aleatorias X1 y X2
• X1 y X2 son normales
• X1 y X2 son independientes
• Las varianzas de X1 y X2 son iguales
Las suposiciones son:
112
Dos
Variables
Variables 
Normales
Muestras
Independientes
Test de 
Student Muestras 
Independientes
Varianzas 
Iguales
ANOVA
Métodos no 
paramétricos
Test de muestras 
pareadas
Efectuar una 
transformación
Corrección
de Welch
NO
NO
NO
NO
SI
SI
SI
SI

Continuar navegando