Logo Studenta

Prueba de Hipotesis Dos Muestras 3a parte

¡Estudia con miles de materiales!

Vista previa del material en texto

1 
RELACIÓN DE LA PRUEBA DE HIPOTESIS CON LA ESTIMACIÓN DEL INTERVALO DE CONFIANZA: 
El procedimiento de prueba de hipótesis para la inferencia estadística abordado está muy relacionado con la estima-
ción del intervalo de confianza estudiado. La estimación del intervalo de confianza incluye el cálculo de límites para 
los cuales es “razonable” que el parámetro en cuestión esté dentro de ellos. Para el caso de una sola media poblacio-
nal  conociendo 2 , la estructura de ambas pruebas de hipótesis y la estimación del intervalo de confianza se basan 
en la variable aleatoria: Z =
n
X
σ
μ0 . 
Resulta entonces que la prueba de H0:  = 0 contra H1 :  0 a un nivel de significancia  es equivalente a calcu-
lar un intervalo de confianza del (1-)100% para  y rechazar H0 si 0 no está dentro del intervalo de confianza. Si 0 
está dentro del intervalo de confianza, la hipótesis no se rechaza. La equivalencia es muy intuitiva y bastante simple 
de ilustrar. Recuerde que con un valor observado x el fracaso a rechazar H0 a un nivel de significancia  implica que 
- z /2  
n
x
σ
μ0  z /2 
lo cual es equivalente a nσzxμnσzx 2/α02/α  
La equivalencia del intervalo de confianza con las pruebas de hipótesis se extiende a diferencias entre dos medias, 
varianzas, razones de varianzas, etc. Como resultado, el estudiante de estadística no debe considerar la estimación 
del intervalo de confianza y la prueba de hipótesis como formas separadas de inferencia estadística. 
 
PRUEBA SOBRE DOS MEDIAS 
1º) PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE DOS MEDIAS POBLACIONALES, VARIANZAS CO-
NOCIDAS 
Desarrollo sobre el procedimiento de prueba 
Suponga que se tienen dos poblaciones de interés. Representemos por X e Y las variables aleatorias poblacionales. 
La primera población X tiene una media desconocida 1 y una varianza 12, mientras que la segunda población Y 
tiene una media desconocida 2 y una varianza 22. 
Suponga que se toma una muestra aleatoria de tamaño n1 de la primera población, 
1
,,, 21 nXXX  y otra muestra 
aleatoria de tamaño n2 de la segunda población 
2
,,, 21 nYYY  . Suponga que las observaciones de la muestra 
1 están distribuidas de manera independiente con media 1 y varianza 12, que las observaciones de la mues-
tra 2 están distribuidas de manera independiente con media 2 y varianza 22, y que las dos muestras {Xi} e 
{Yj} son independientes. 
El interés recae en probar la hipótesis de que las dos medias poblacionales 1 y 2 son iguales. En este caso la 
hipótesis nula será H0: 1 = 2 y es equivalente a probar que 1 - 2 = 0. 
En forma más general se quiere probar la hipótesis que las medias poblacionales difieren en una cantidad d0, en 
este caso H0 : 1 - 2 = d0. 
Considere primero las hipótesis alternativas bilaterales 
H0: 1 – 2 = d0 H1: 1 – 2  d0 
El procedimiento de prueba se basa en la distribución de la diferencia entre las medias muestrales X - Y . En gene-
ral, se sabe que, a la luz de las hipótesis anteriores, la distribución de X - Y , es normal con media 1 – 2 y va-
rianza 12/n1 + 22/n2 . 
Esto es, X - Y  N ( 1 – 2 , 12/n1 + 22/n2 ) 
Suponga que las dos poblaciones son normales, y que si no lo son se cumplen las condiciones del Teorema Central 
del Límite. 
 2 
Por lo tanto si la hipótesis nula H0: 1 – 2 = d0 es verdadera, X - Y  N ( d0 , 12/n1 + 22/n2 ) 
y el estadístico de prueba Z = 
2
2
21
2
1
0
nn
dYX

 (1) tiene una distribución normal estándar. 
La región de rechazo está formada por los z > 2/z y z < - 2/z 
Por consiguiente, el procedimiento para probar H0: 1 – 2 = d0 versus H1: 1 – 2  d0 es: 
Con las muestras obtenidas 
1
,,, 21 nxxx  e 2,,, 21 nyyy  calcule x e y y calcule z calculado ,el valor numérico 
del estadístico de prueba de la ecuación (1) , esto es 
 z cal=
2
2
21
2
1
0
nn
dyx

 y rechace la hipótesis nula si y solo si z calculado pertenece a la región de rechazo. 
Relación con la estimación del intervalo de confianza: Resulta que la prueba de H0: 1 – 2 = d0 contra H1: 1 – 
2  d0 a un nivel de significancia  es equivalente a calcular un intervalo de confianza del (1-)100% para 1 – 2 y 
rechazar H0 si d0 no está dentro del intervalo de confianza.Si d0 está dentro del intervalo de confianza, la hipótesis no 
se rechaza. 
El intervalo de confianza del (1-)100% para 1 – 2 será: 
2
2
2
1
2
1
2α21
2
2
2
1
2
1
2α
σσ
μμ
σσ
nn
zyx
nn
zyx //  
Las hipótesis alternativas unilaterales se analizan de la siguiente forma: 
 Para probar H0: 1 – 2 = d0 vs H1: 1 – 2 > d0, la región de rechazo está formada por los z > z  
 Para probar H0: 1 – 2 = d0 vs H1: 1 – 2 < d0 , la región de rechazo está formada por los z < - z  . 
En ambos casos, a partir de la muestra disponible se calcula el estadístico de prueba zcalculado en la ecuación (1) y se 
rechaza H0 si pertenece a la región de rechazo. 
2º) PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS DE DOS DISTRIBUCIONES NORMALES, 
VARIANZAS DESCONOCIDAS 
Ahora consideraremos pruebas de hipótesis sobre la diferencia de medias (en particular sobre la igualdad de medias) 
1 y 2 de dos distribuciones normales donde las varianzas 12 y 22 son desconocidas. Para probar esta hipó-
tesis se usará un estadístico de prueba t. Tal como ya se indicó al tratar estimación, se requiere la hipótesis de nor-
malidad para desarrollar el procedimiento de prueba, pero los alejamientos moderados de la normalidad no tendrán 
efectos adversos sobre el procedimiento. Es necesario considerar dos situaciones diferentes. En el primer caso, se 
supondrá que las varianzas de las dos distribuciones son desconocidas pero iguales; esto es 12 = 22 = 2 . En el 
segundo caso, se supondrá que 12 y 22 son desconocidas y no necesariamente iguales. 
Caso I : 12 = 22 = 2 
Suponga que se tienen dos poblaciones normales independientes con medias desconocidas 1 y 2 ,y varianzas des-
conocidas pero iguales 12 = 22 = 2. Se desea probar 
H0: 1 – 2 = d0 vs H1: 1 – 2  d0 
Sean 
1
,,, 21 nXXX  , una muestra aleatoria de tamaño n1 tomada de la primera población, e 2,,, 21 nYYY  una 
muestra aleatoria de tamaño n2 tomada de la segunda población. Sean X , Y , S12, S22 las medias muestrales y las 
varianzas muestrales respectivamente. Puesto que tanto S12 como S22 son estimaciones de la varianza común 2 , 
pueden combinarse para formar un solo estimador, por ejemplo, 
Sp2= 
2nn
S)1n(S)1n(
21
2
22
2
11


 
 3 
Estadístico de Prueba: Si H0 es verdadera el estadístico de prueba 
(2) t = 
21p
0
n1n1S
dYX


 tiene una distribución  t 2nn 21  
La región de rechazo está formada por los t > 2nn2/ 21,t  y t < - 2nn2/ 21,t  
Procedimiento de Prueba: Si tcalculado es el valor del estadístico de prueba calculado a partir de la muestra, entonces se 
rechaza H0: 1 – 2 = d0 al nivel de significancia  si y solo si tcalculado pertenece a la región de rechazo. 
Las alternativas unilaterales se tratan de manera similar. 
 Para probar H0: 1 – 2 = d0 vs H1: 1 – 2 > d0, 
La región de rechazo está formada por los t > 2nn 21,t  
Luego, se calcula el estadístico de prueba tcalculado de la ecuación (2) y se rechaza H0 si tcalc > 2nn 21,t  
 Para probar H0: 1 – 2 = d0 vs H1: 1 – 2 < d0 , 
La región de rechazo está formada por los t < - 2nn 21,t  . 
En ambos casos, a partir de la muestra disponible se calcula el estadístico de prueba tcalculado en la ecuación (2) y se 
rechaza H0 si tcalculado pertenece a la región de rechazo. 
La prueba t para dos muestras dada recibe a menudo el nombre de pruebat combinada, ya que las varianzas mues-
trales se combinan para estimar la varianza común. También se conoce como prueba t independiente, debido a que 
se supone que las dos poblaciones normales son independientes. 
Caso II : 12  22 
En algunas situaciones no es razonable suponer que las varianzas desconocidas 12 y 22 son iguales. En este caso 
no existe un estadístico de prueba exacto para probar H0: 1 – 2 = d0. Sin embargo, si la hipótesis nula es verda-
dera, el estadístico 
T* = 
2
2
21
2
1
0
nSnS
dYX

 tiene una distribución t con  grados de libertad, donde los grados de libertad están dados 
por  =  
   



 



 

)1n(ns)1n(ns
nsns
2
2
2
2
21
2
1
2
1
2
2
2
21
2
1 
Por lo tanto si 12  22 , las hipótesis 
H0: 1 – 2 = d0 H0: 1 – 2 = d0 H0: 1 – 2 = d0 
H1: 1 – 2  d0 H1: 1 – 2 > d0 H1: 1 – 2 < d0 
se prueban igual que en el caso I, con la excepción que se emplea T* como estadístico de prueba, reemplazando n1 
+ n2 - 2 por  para determinar los grados de libertad de la prueba. 
3º) PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS DE DOS DISTRIBUCIONES CON VARIAN-
ZAS DESCONOCIDAS DE POBLACIONES NO NORMALES – MUESTRAS GRANDES 
En el caso de muestras grandes (n1  30 y n2  30 ) de poblaciones no normales, podemos usar el procedimiento de 
prueba (1°) para probar hipótesis sobre la diferencia de medias. Para ello se sustituyen en (1) 12 y 22 por S12 y S22 
respectivamente, entendiendo que para muestras grandes las varianzas muestrales proporcionan buenas aproxima-
ciones de sus correspondientes varianzas poblacionales. 
 
 4 
4º) PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS CUANDO LAS OBSERVACIONES ESTÁN 
APAREADAS. 
El procedimiento de prueba comprende la diferencia entre cada par de observaciones. Sea (X1, Y1), (X2, Y2), ..., (Xn, 
Yn) un conjunto de n pares de variables aleatorias que representan las cantidades medibles asociadas con los ensa-
yos 1, 2, ..., n respectivamente. Obtenga la diferencia entre cada par de observaciones, es decir, 
D1 = X1 - Y1, D1 = X2 -Y2, ..., Dn = Xn - Yn. Se supone que estas diferencias son variables aleatorias independientes 
distribuidas normalmente, cada una con una media común desconocida D y una varianza común desconocida D2 
Para probar las hipótesis: 
H0: D = d0 H0: D = d0 H0: D = d0 
H1: D  d0 H1: D > d0 H1: D < d0 
al nivel de significación . 
Bajo la hipótesis nula el estadístico de Prueba t = 
nS
dD
D
0 (3), tiene distribución t con n – 1 grados de libertad 
Las respectivas regiones de rechazo están formada por los 
 t  > 1n2/ ,t  t > 1n,t  t < - 1n,t  
Procedimiento de prueba: Con las diferencias calculadas a partir de la muestra: d1, d2, ..., dn se calculan d y sD y se 
calcula el valor del estadístico (3) tcalculado= 
ns
dd
D
0 y se rechaza H0 al nivel de significación  si y solo si ) tcalculado perte-
nece a las respectivas regiones de rechazo. 
 
PRUEBA CHI CUADRADO DE BONDAD DE AJUSTE 
El procedimiento de prueba requiere una muestra aleatoria de tamaño n proveniente de la población cuya distribución 
es desconocida. Estas n observaciones se acomodan en un histograma de frecuencia, el cual tiene k intervalos de 
clase. Sea Oi la frecuencia observada en el i-ésimo intervalo de clase. De la distribución de probabilidad propuesta, se 
calcula la frecuencia esperada en el i.ésimo intervalo de clase, la cual se denota por E i = n pi. Se acostumbra redon-
dear estas frecuencias a un decimal. 
El estadístico de prueba es 




k
i i
ii
E
EO
1
2
2 )( 
Puede demostrarse que, si la población sigue la distribución propuesta, 
2 tiene, de manera aproximada, una distri-
bución chi-cuadrada con k – p – 1 grados de libertad, donde p representa el número de parámetros de la distribución 
propuesta estimada por los estadísticos muestrales. Esta aproximación mejora a medida que n aumenta. 
Región de rechazo: 
2 > 1,
2
 pk 
Debe rechazarse la hipótesis de que la distribución de la población es la distribución propuesta, si el valor calculado 
del estadístico de prueba 
2 calculado > 1,
2
 pk 
Un aspecto que debe notarse en la aplicación de este procedimiento de prueba es el relacionado con la magnitud de 
las frecuencias esperadas. Si estas frecuencias son muy pequeñas entonces el estadístico de prueba 
2 calculado no 
reflejará el alejamiento entre lo observado y lo esperado, sino la pequeña magnitud de las frecuencias esperadas. No 
hay ningún acuerdo general con respecto al valor mínimo de las frecuencias esperadas, pero los valores 3, 4 y 5 son 
los que más se utilizan como mínimos. Algunos autores sugieren que las frecuencias esperadas pueden ser tan pe-
queñas como 1 o 2, con tal de que muchas de ellas sean mayores que 5. Sí se espera que una frecuencia sea dema-
siado pequeña, entonces puede combinarse con la frecuencia esperada en un intervalo de clase adyacente. Las fre-
cuencias observadas correspondientes también se combinan, por lo que k debe disminuirse en uno. No es necesario 
que los intervalos de clase tengan el mismo ancho.

Continuar navegando