Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 RELACIÓN DE LA PRUEBA DE HIPOTESIS CON LA ESTIMACIÓN DEL INTERVALO DE CONFIANZA: El procedimiento de prueba de hipótesis para la inferencia estadística abordado está muy relacionado con la estima- ción del intervalo de confianza estudiado. La estimación del intervalo de confianza incluye el cálculo de límites para los cuales es “razonable” que el parámetro en cuestión esté dentro de ellos. Para el caso de una sola media poblacio- nal conociendo 2 , la estructura de ambas pruebas de hipótesis y la estimación del intervalo de confianza se basan en la variable aleatoria: Z = n X σ μ0 . Resulta entonces que la prueba de H0: = 0 contra H1 : 0 a un nivel de significancia es equivalente a calcu- lar un intervalo de confianza del (1-)100% para y rechazar H0 si 0 no está dentro del intervalo de confianza. Si 0 está dentro del intervalo de confianza, la hipótesis no se rechaza. La equivalencia es muy intuitiva y bastante simple de ilustrar. Recuerde que con un valor observado x el fracaso a rechazar H0 a un nivel de significancia implica que - z /2 n x σ μ0 z /2 lo cual es equivalente a nσzxμnσzx 2/α02/α La equivalencia del intervalo de confianza con las pruebas de hipótesis se extiende a diferencias entre dos medias, varianzas, razones de varianzas, etc. Como resultado, el estudiante de estadística no debe considerar la estimación del intervalo de confianza y la prueba de hipótesis como formas separadas de inferencia estadística. PRUEBA SOBRE DOS MEDIAS 1º) PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE DOS MEDIAS POBLACIONALES, VARIANZAS CO- NOCIDAS Desarrollo sobre el procedimiento de prueba Suponga que se tienen dos poblaciones de interés. Representemos por X e Y las variables aleatorias poblacionales. La primera población X tiene una media desconocida 1 y una varianza 12, mientras que la segunda población Y tiene una media desconocida 2 y una varianza 22. Suponga que se toma una muestra aleatoria de tamaño n1 de la primera población, 1 ,,, 21 nXXX y otra muestra aleatoria de tamaño n2 de la segunda población 2 ,,, 21 nYYY . Suponga que las observaciones de la muestra 1 están distribuidas de manera independiente con media 1 y varianza 12, que las observaciones de la mues- tra 2 están distribuidas de manera independiente con media 2 y varianza 22, y que las dos muestras {Xi} e {Yj} son independientes. El interés recae en probar la hipótesis de que las dos medias poblacionales 1 y 2 son iguales. En este caso la hipótesis nula será H0: 1 = 2 y es equivalente a probar que 1 - 2 = 0. En forma más general se quiere probar la hipótesis que las medias poblacionales difieren en una cantidad d0, en este caso H0 : 1 - 2 = d0. Considere primero las hipótesis alternativas bilaterales H0: 1 – 2 = d0 H1: 1 – 2 d0 El procedimiento de prueba se basa en la distribución de la diferencia entre las medias muestrales X - Y . En gene- ral, se sabe que, a la luz de las hipótesis anteriores, la distribución de X - Y , es normal con media 1 – 2 y va- rianza 12/n1 + 22/n2 . Esto es, X - Y N ( 1 – 2 , 12/n1 + 22/n2 ) Suponga que las dos poblaciones son normales, y que si no lo son se cumplen las condiciones del Teorema Central del Límite. 2 Por lo tanto si la hipótesis nula H0: 1 – 2 = d0 es verdadera, X - Y N ( d0 , 12/n1 + 22/n2 ) y el estadístico de prueba Z = 2 2 21 2 1 0 nn dYX (1) tiene una distribución normal estándar. La región de rechazo está formada por los z > 2/z y z < - 2/z Por consiguiente, el procedimiento para probar H0: 1 – 2 = d0 versus H1: 1 – 2 d0 es: Con las muestras obtenidas 1 ,,, 21 nxxx e 2,,, 21 nyyy calcule x e y y calcule z calculado ,el valor numérico del estadístico de prueba de la ecuación (1) , esto es z cal= 2 2 21 2 1 0 nn dyx y rechace la hipótesis nula si y solo si z calculado pertenece a la región de rechazo. Relación con la estimación del intervalo de confianza: Resulta que la prueba de H0: 1 – 2 = d0 contra H1: 1 – 2 d0 a un nivel de significancia es equivalente a calcular un intervalo de confianza del (1-)100% para 1 – 2 y rechazar H0 si d0 no está dentro del intervalo de confianza.Si d0 está dentro del intervalo de confianza, la hipótesis no se rechaza. El intervalo de confianza del (1-)100% para 1 – 2 será: 2 2 2 1 2 1 2α21 2 2 2 1 2 1 2α σσ μμ σσ nn zyx nn zyx // Las hipótesis alternativas unilaterales se analizan de la siguiente forma: Para probar H0: 1 – 2 = d0 vs H1: 1 – 2 > d0, la región de rechazo está formada por los z > z Para probar H0: 1 – 2 = d0 vs H1: 1 – 2 < d0 , la región de rechazo está formada por los z < - z . En ambos casos, a partir de la muestra disponible se calcula el estadístico de prueba zcalculado en la ecuación (1) y se rechaza H0 si pertenece a la región de rechazo. 2º) PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS DE DOS DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS Ahora consideraremos pruebas de hipótesis sobre la diferencia de medias (en particular sobre la igualdad de medias) 1 y 2 de dos distribuciones normales donde las varianzas 12 y 22 son desconocidas. Para probar esta hipó- tesis se usará un estadístico de prueba t. Tal como ya se indicó al tratar estimación, se requiere la hipótesis de nor- malidad para desarrollar el procedimiento de prueba, pero los alejamientos moderados de la normalidad no tendrán efectos adversos sobre el procedimiento. Es necesario considerar dos situaciones diferentes. En el primer caso, se supondrá que las varianzas de las dos distribuciones son desconocidas pero iguales; esto es 12 = 22 = 2 . En el segundo caso, se supondrá que 12 y 22 son desconocidas y no necesariamente iguales. Caso I : 12 = 22 = 2 Suponga que se tienen dos poblaciones normales independientes con medias desconocidas 1 y 2 ,y varianzas des- conocidas pero iguales 12 = 22 = 2. Se desea probar H0: 1 – 2 = d0 vs H1: 1 – 2 d0 Sean 1 ,,, 21 nXXX , una muestra aleatoria de tamaño n1 tomada de la primera población, e 2,,, 21 nYYY una muestra aleatoria de tamaño n2 tomada de la segunda población. Sean X , Y , S12, S22 las medias muestrales y las varianzas muestrales respectivamente. Puesto que tanto S12 como S22 son estimaciones de la varianza común 2 , pueden combinarse para formar un solo estimador, por ejemplo, Sp2= 2nn S)1n(S)1n( 21 2 22 2 11 3 Estadístico de Prueba: Si H0 es verdadera el estadístico de prueba (2) t = 21p 0 n1n1S dYX tiene una distribución t 2nn 21 La región de rechazo está formada por los t > 2nn2/ 21,t y t < - 2nn2/ 21,t Procedimiento de Prueba: Si tcalculado es el valor del estadístico de prueba calculado a partir de la muestra, entonces se rechaza H0: 1 – 2 = d0 al nivel de significancia si y solo si tcalculado pertenece a la región de rechazo. Las alternativas unilaterales se tratan de manera similar. Para probar H0: 1 – 2 = d0 vs H1: 1 – 2 > d0, La región de rechazo está formada por los t > 2nn 21,t Luego, se calcula el estadístico de prueba tcalculado de la ecuación (2) y se rechaza H0 si tcalc > 2nn 21,t Para probar H0: 1 – 2 = d0 vs H1: 1 – 2 < d0 , La región de rechazo está formada por los t < - 2nn 21,t . En ambos casos, a partir de la muestra disponible se calcula el estadístico de prueba tcalculado en la ecuación (2) y se rechaza H0 si tcalculado pertenece a la región de rechazo. La prueba t para dos muestras dada recibe a menudo el nombre de pruebat combinada, ya que las varianzas mues- trales se combinan para estimar la varianza común. También se conoce como prueba t independiente, debido a que se supone que las dos poblaciones normales son independientes. Caso II : 12 22 En algunas situaciones no es razonable suponer que las varianzas desconocidas 12 y 22 son iguales. En este caso no existe un estadístico de prueba exacto para probar H0: 1 – 2 = d0. Sin embargo, si la hipótesis nula es verda- dera, el estadístico T* = 2 2 21 2 1 0 nSnS dYX tiene una distribución t con grados de libertad, donde los grados de libertad están dados por = )1n(ns)1n(ns nsns 2 2 2 2 21 2 1 2 1 2 2 2 21 2 1 Por lo tanto si 12 22 , las hipótesis H0: 1 – 2 = d0 H0: 1 – 2 = d0 H0: 1 – 2 = d0 H1: 1 – 2 d0 H1: 1 – 2 > d0 H1: 1 – 2 < d0 se prueban igual que en el caso I, con la excepción que se emplea T* como estadístico de prueba, reemplazando n1 + n2 - 2 por para determinar los grados de libertad de la prueba. 3º) PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS DE DOS DISTRIBUCIONES CON VARIAN- ZAS DESCONOCIDAS DE POBLACIONES NO NORMALES – MUESTRAS GRANDES En el caso de muestras grandes (n1 30 y n2 30 ) de poblaciones no normales, podemos usar el procedimiento de prueba (1°) para probar hipótesis sobre la diferencia de medias. Para ello se sustituyen en (1) 12 y 22 por S12 y S22 respectivamente, entendiendo que para muestras grandes las varianzas muestrales proporcionan buenas aproxima- ciones de sus correspondientes varianzas poblacionales. 4 4º) PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS CUANDO LAS OBSERVACIONES ESTÁN APAREADAS. El procedimiento de prueba comprende la diferencia entre cada par de observaciones. Sea (X1, Y1), (X2, Y2), ..., (Xn, Yn) un conjunto de n pares de variables aleatorias que representan las cantidades medibles asociadas con los ensa- yos 1, 2, ..., n respectivamente. Obtenga la diferencia entre cada par de observaciones, es decir, D1 = X1 - Y1, D1 = X2 -Y2, ..., Dn = Xn - Yn. Se supone que estas diferencias son variables aleatorias independientes distribuidas normalmente, cada una con una media común desconocida D y una varianza común desconocida D2 Para probar las hipótesis: H0: D = d0 H0: D = d0 H0: D = d0 H1: D d0 H1: D > d0 H1: D < d0 al nivel de significación . Bajo la hipótesis nula el estadístico de Prueba t = nS dD D 0 (3), tiene distribución t con n – 1 grados de libertad Las respectivas regiones de rechazo están formada por los t > 1n2/ ,t t > 1n,t t < - 1n,t Procedimiento de prueba: Con las diferencias calculadas a partir de la muestra: d1, d2, ..., dn se calculan d y sD y se calcula el valor del estadístico (3) tcalculado= ns dd D 0 y se rechaza H0 al nivel de significación si y solo si ) tcalculado perte- nece a las respectivas regiones de rechazo. PRUEBA CHI CUADRADO DE BONDAD DE AJUSTE El procedimiento de prueba requiere una muestra aleatoria de tamaño n proveniente de la población cuya distribución es desconocida. Estas n observaciones se acomodan en un histograma de frecuencia, el cual tiene k intervalos de clase. Sea Oi la frecuencia observada en el i-ésimo intervalo de clase. De la distribución de probabilidad propuesta, se calcula la frecuencia esperada en el i.ésimo intervalo de clase, la cual se denota por E i = n pi. Se acostumbra redon- dear estas frecuencias a un decimal. El estadístico de prueba es k i i ii E EO 1 2 2 )( Puede demostrarse que, si la población sigue la distribución propuesta, 2 tiene, de manera aproximada, una distri- bución chi-cuadrada con k – p – 1 grados de libertad, donde p representa el número de parámetros de la distribución propuesta estimada por los estadísticos muestrales. Esta aproximación mejora a medida que n aumenta. Región de rechazo: 2 > 1, 2 pk Debe rechazarse la hipótesis de que la distribución de la población es la distribución propuesta, si el valor calculado del estadístico de prueba 2 calculado > 1, 2 pk Un aspecto que debe notarse en la aplicación de este procedimiento de prueba es el relacionado con la magnitud de las frecuencias esperadas. Si estas frecuencias son muy pequeñas entonces el estadístico de prueba 2 calculado no reflejará el alejamiento entre lo observado y lo esperado, sino la pequeña magnitud de las frecuencias esperadas. No hay ningún acuerdo general con respecto al valor mínimo de las frecuencias esperadas, pero los valores 3, 4 y 5 son los que más se utilizan como mínimos. Algunos autores sugieren que las frecuencias esperadas pueden ser tan pe- queñas como 1 o 2, con tal de que muchas de ellas sean mayores que 5. Sí se espera que una frecuencia sea dema- siado pequeña, entonces puede combinarse con la frecuencia esperada en un intervalo de clase adyacente. Las fre- cuencias observadas correspondientes también se combinan, por lo que k debe disminuirse en uno. No es necesario que los intervalos de clase tengan el mismo ancho.
Compartir